conceptos y fundamentos estadísticos

49
Conceptos y fundamentos estadísticos Ingeniería de Calidad 2021

Upload: others

Post on 15-Mar-2022

5 views

Category:

Documents


0 download

TRANSCRIPT

Conceptos y fundamentos estadísticos

Ingeniería de Calidad2021

• Sea X una v.a. continua. Se dice que X sigue una distribución normalde probabilidad de media (µ) y desviación típica (σ)

X ~ N (µ, σ)

Si la función de probabilidad es:

• El centro coincide con μ, y la amplitud está determinada por σ.

Distribución NormalIngeniería de Calidad 2021

Distribución Normal

• La media proporciona la localización y la desviación estándar ladispersión.

• El gráfico de la campana de Gauss se representa en la figura

Ingeniería de Calidad 2021

• N(μ, σ ), entonces se cumple que:

• 1. P(μ − σ < X < μ + σ) = 0.6827

• 2. P(μ − 2σ < X < μ + 2σ) = 0.9545

• 3. P(μ − 3σ < X < μ + 3σ) = 0.9973

• 4. P(X = a) = 0 para cualquier número a.

• Estas propiedades señalan la proporción de la distribución normal quese localiza en torno a la media μ.

• Entre más menos una desviación estándar de la media se ubica en68.27% del área; y en la media más menos tres veces σ se encuentra99.73% de la distribución.

Distribución Normal: Propiedades

Entre la media y 1 desviacióntenemos siempre la mismaprobabilidad: aprox 68%

Entre la media y 2 desv aprox95%

Distribuciones discretas: Distribución binomial• Un experimento aleatorio donde los posibles resultados de cada

ensayo son: “éxito” o “fracaso” se conoce como experimentoBernoulli.

• Para una secuencia de n ensayos Bernoulli donde se cumple que:

1. Los ensayos son independientes.

2. La probabilidad de éxito en cada ensayo, denotada por p, permanececonstante.

La variable aleatoria X, que es igual al número de ensayos donde elresultado es un éxito, tiene una distribución binomial (n, p). La funciónde probabilidades de X es,

Ingeniería de Calidad 2021

es el número de combinaciones de n elementos tomados de x en x.

μ = E(X) = np y σ2 = V(X) = np(1− p)

es más adecuado trabajar con la proporción (X/n), en lugar de con elnúmero X (de artículos defectuosos). Entonces, su distribuciónacumulada está dada por:

[nr] es igual al entero más grande que es menor o igual a nr. Lamedia de Ƹ𝑝 es p y su varianza es p(1 – p)/n.

Distribuciones discretas: Distribución binomial

Ingeniería de Calidad 2021

Distribución de Poisson

• En un control de calidad es frecuente que se evalúe número deeventos que ocurren por unidad (por unidad de área, por unidad devolumen, por unidad de tiempo, etc.).

• Es frecuente que este tipo de variables tenga una distribución dePoisson, cuya función de distribución de probabilidades está dadapor:

e = 2.71828 y ! es el símbolo factorial

μ = λ número medio de veces que ocurre el suceso en el intervalo de tiempo, longitud, área

σ 2 = λ. Requisitos: aleatoriedad y los sucesos en el intervalo deben ser independientes

Ingeniería de Calidad 2021

Aplicaciones: Distribución normal• Existen tablas que presentan los valores de las áreas bajo la curva para

diversos Z, por lo que no es necesario calcular la integral.

• Ejemplo: Una gran cantidad de mediciones del voltaje de suministro aresidencias muestra una media de 118.5 V y una desviación estándarpoblacional de 1.20 V. Determinar el porcentaje de los datos entre 116 V y120 V.

Para calcular la solución se requiere restar el área a la izquierda de 116 V delárea a la izquierda de 120 V.

Ingeniería de Calidad 2021

De acuerdo con la tabla A, para Z2 = -2.08, Área2 = 0.0188;

para Z3 = 1.25, Área3 = 0.8944.

Área1 = Área3 - Área2

= 0.8944 - 0.0188

= 0.8756 o 87.56%

Entonces, 87.56% de los datos están entre 116 V y 120 V.

PROBLEMA DE EJEMPLO 4-12-Besterfield 8va ed. Pág. 160

Aplicaciones: Distribución normalIngeniería de Calidad 2021

Tabla para el ejemplo

Besterfield 8va ed. Pág. 512

Ingeniería de Calidad 2021

Aplicaciones: Distribución Binomial

De una gran cantidad de artículos en promedio 2% están defectuosos. Seempacan en cajas de 10, y se quiere saber la probabilidad de cero artículosdefectuoso en cada caja. Entonces, se quiere obtener P(X = 0)

Se espera que 82% de las cajas no tenga artículo defectuoso, que el restante18% tendrá al menos uno.

La probabilidad de que cada caja tenga un artículo defectuoso P(X = 1):

Se espera que 16.7% de las cajas tenga exactamente un artículo defectuoso.

Ingeniería de Calidad 2021

En una empresa se reciben en promedio 5 quejas diarias por malservicio. Si el número de quejas por día se distribuye Poisson con λ = 5,¿cuál es la probabilidad de no recibir quejas en un día? Esto se obtienecon:

Es muy baja, por lo que sería muy raro que en un día no se recibieraninguna queja.

Aplicaciones: Distribución Poisson

Ingeniería de Calidad 2021

Fundamentos estadísticos

A continuación se describen los fundamentos de la estadística, gráficasde control para variables, técnicas adicionales de control estadístico delproceso (SPC, de Statistical Process Control) para variables,fundamentos de probabilidad y gráficas de control para atributos. Paraterminar se describe el muestreo de aceptación, planes y conceptos dediseño

Ingeniería de Calidad 2021

• Necesarios para comprender las técnicas de control de calidad

RECOLECCIÓN DE LOS DATOS

Los datos que se recolectan para fines de calidad se obtienen porobservación directa, y se clasifican como variables o atributos. Lasvariables son aquellas características de la calidad que se puedenmedir, como peso en gramos. Los atributos, por otra parte, sonaquellas características de calidad que se clasifican como conformes ono conformes a las especificaciones, como un “calibrador pasa-nopasa.”

Fundamentos estadísticos

Ingeniería de Calidad 2021

Con respecto a los instrumentos, puede ocurrir que no obtengan una lectura correcta.Problemas de exactitud y precisión.

Precisión: grado de proximidad entre los resultados de mediciones de la misma muestrabajo las mismas condiciones de medición

Exactitud: estima la concordancia entre el resultado de una medición y el valor real de unacantidad mesurable

Muchas fallas se deben a la variación del redondeo. Si el último dígito es 5 o más, elnúmero se redondea hacia arriba

Variables

Depende de la exactitud del instrumento. Datos medibles.Como el peso, 11 kg, 11.33 kg o 11.3398 kg

Poseen discontinuidades, son contables. La cantidad deremaches no conformes puede ser cualquier númeroentero, como 0, 3, 5, 10, 96, ...; sin embargo, no puede serque haya, por ej. 4.65.

Continuas

Discretas

Ingeniería de Calidad 2021

Fundamentos estadísticos

5.655-5.645

0.01÷2 0.005÷5.65

Las cifras significativas de un número son los dígitos. Por ejemplo, el número 3.69tiene tres cifras significativas; 36.900 tiene cinco cifras significativas; 22.0365 tieneseis cifras significativas, y 0.00270 tiene tres cifras significativas. Los ceros a laderecha se cuentan como significativas, mientras que los de la izquierda no.Al seguir estas reglas se evitarán discrepancias en los resultados, entre el personalde calidad.

Ingeniería de Calidad 2021

DESCRIPCIÓN DE LOS DATOS

Si un gran volumen de datos no se grafica y/o analiza adecuadamentepuede ser poco útil.

La técnica gráfica es una imagen de la distribución de frecuencia, quees un resumen de cómo los puntos de datos (las observaciones) sepresentan dentro de cada subdivisión de los valores observados.

Las técnicas analíticas resumen datos al calcular una medida de latendencia central y una medida de la dispersión.

Fundamentos estadísticos

Ingeniería de Calidad 2021

TÉCNICAS GRÁFICAS: DISTRIBUCIÓN DE FRECUENCIA (Datos sin agrupar)

Distribución de frecuencia:Primer paso, organizar elconjunto de datos y tabular lafrecuencia.

Ingeniería de Calidad 2021Ingeniería de Calidad 2021

Hay varias formas diferentes de representarla para mayor claridad.Un histograma, distribución de frecuencia relativa, la frecuenciaacumulada, la frecuencia acumulada relativa

Ingeniería de Calidad 2021

Datos agrupados: La mayor parte de los datos son continuos, nodiscretos, y requieren agruparse.

Cuando se trata de muchos datos, se deben separar en categorías (losque se repiten) y agruparlos en clases (agrupamiento dentro de límitesespecificados).

Para determinar el número de clase:

5 a 9 clases para observaciones menores que 100;

8 a 17 clases, observaciones entre 100 y 500,

15 a 20 clases, cuando la cantidad de observaciones es mayor de 500.

Ajustar cuando sea necesario.

Ingeniería de Calidad 2021

Rango (o recorrido) es la diferencia entre el mayor valor observado y elmenor valor observado, como indica la fórmula:

R = Xh – Xl

El intervalo de clase es la distancia entre los puntos medios de clasesadyacentes. Regla de Sturgis

El punto medio de la clase, límites declase, se observan en la figura

Ingeniería de Calidad 2021

Esta distribución de frecuencia permite tener un mejor concepto delvalor central, y la forma en que los datos están dispuestos en torno aese valor

Ingeniería de Calidad 2021Ingeniería de Calidad 2021

Diagrama de cajaDe gran utilidad para hacer análisis comparativos de procesos, tratamientos,proveedores, lotes, etc. Proporciona una visión rápida de la distribución. Sebasa en los cuartiles y divide los datos ordenados en grupos.

Se visualiza dónde termina de acumularse 25% de los datos menores, y apartir de dónde se localiza 25% de los datos mayores. Entre estos doscuartiles se ubica 50% de los datos que están al centro.

Pueden ser horizontales o verticales

Ingeniería de Calidad 2021

MÉTODODOS ANALÍTICOS: MEDIDAS DE TENDENCIA CENTRAL

Es un valor numérico que describe la posición central de los datos. Haytres medidas de uso común.

• Promedio: Suma de las observaciones dividida entre la cantidad deobservaciones. Tres técnicas diferentes disponibles para calcular elpromedio (VER ANEXO PROMEDIO).

• Mediana: El valor que divide una serie de observaciones ordenadasde tal manera que la cantidad de elementos arriba de ella es igual a lacantidad de elementos abajo de ella (VER ANEXO MEDIANA).

• Moda (Mo): Es el valor que se presenta con la máxima frecuencia.Puede ser unimodal, bimodal, multimodal y puede que no existamoda.

https://es.slideshare.net/jpgv84/estadstica-descriptiva-presentation-882182

Ingeniería de Calidad 2021

MÉTODODOS ANALÍTICOS: MEDIDAS DE TENDENCIA CENTRAL

https://es.slideshare.net/jpgv84/estadstica-descriptiva-presentation-882182

Ingeniería de Calidad 2021

MÉTODODOS ANALÍTICOS: MEDIDAS DE DISPERSIÓN

Describen la forma en que los datos se extienden o dispersan a cadalado del valor central.

Rango: Es la diferencia entre los valores u observaciones mayor ymenor.

Desviación estándar (s): Mide la tendencia de los datos a la dispersión.(ANEXO DESVIACIÓN ESTÁNDAR)

Varianza (s2): Medida de la variabilidad en estadística superior

Otras medidas como sesgo y curtosis disponibles en el anexo.

Ingeniería de Calidad 2021Ingeniería de Calidad 2021

MUESTREO

Como rara vez es posible medir toda la población, se selecciona unamuestra. Es necesario tomar muestras cuando no sea imposible medirtoda la población, cuando el costo de observar todos los datos seaprohibitivo, cuando se destruye el producto con la inspección, ocuando es demasiado peligroso probar toda la población, como en elcaso de un medicamento nuevo.

Muestreo de aceptación: Es el proceso de inspección de una muestra de unidades de un lote con el propósito de aceptar o rechazar todo el lote.

Ingeniería de Calidad 2021

• Se selecciona el número de muestras de un lote, se establece el limitede aceptación (cantidad de fallas por lote). Si aparecen más piezasdefectuosas que el límite establecido, el lote es rechazado.

• El muestreo de aceptación es una forma particular de inspección, enla que simplemente se aceptan y rechazan lotes, pero no mejora lacalidad.

Tipos de planes de muestreo

Planes por variables: Es cuando a cada unidad de la muestra se le mide una variable continua y con los datos se calcula un estadístico.

Planes por atributos: Cuando cada artículo de la muestra se clasificacomo conforme o no conforme; la cantidad de no conformes se utilizapara aceptar o rechazar el lote.

Ingeniería de Calidad 2021

• Muestreo por atributos: simple, se toma una muestra de n artículos ysi el número de artículos defectuosos es menor o igual que ciertonúmero c el lote se acepta. Doble, se pueden tomar hasta dosmuestras para decidir si un lote se acepta y múltiple, se puedenextraer dos o más muestras para aceptar o rechazar el lote.

• Formación del lote y selección de la muestra: Deben serhomogéneos, deben ser formados de manera que no compliquen sumanejo durante la inspección, los lotes deben ser tan grandes comosea posible, siempre y cuando no afecte demasiado a los costos ytiempos.

• Selección de la muestra: Muestreo aleatorio simple

Es cuando los artículos se escogen al azar de manera que cada posiblemuestra tiene igual oportunidad de resultar seleccionada.

Ingeniería de Calidad 2021

Curva característica de operación para planes de muestreo (CO)• Muestra el desempeño de un plan de muestreo al dar la probabilidad de

aceptar lotes con niveles de calidad dados.

• En una fábrica se producen lotes de tamaño grande, antes de enviarlos alcliente se les aplica el plan de muestreo simple por atributos definido porn=60, c=1. si se encuentra cero o a lo más un defectuoso, el lote es aceptado.Pero si se encuentran dos artículos o más que son defectuosos, entonces ellote es rechazado y se debe realizar inspección al 100%.

• La curva CO de un plan proporciona una caracterización del desempeñopotencial. En la tabla se muestra la probabilidad de aceptación del plan n=60,c=1 para diferentes valores de p.

• Para calcular las probabilidades de aceptación se utiliza la distribuciónbinomial con parámetros n y p

Ingeniería de Calidad 2021

Ejemplo de aplicación

Control estadístico de calidad y seis sigma. Humberto Gutiérrez Pulido. Segunda edición. Pag 327

Ingeniería de Calidad 2021

Ejemplo de aplicación

Ingeniería de Calidad 2021

Una curva característica de operación evalúa la eficacia de determinado plan de muestreo.Si ese plan de muestreo no es satisfactorio, como indica la curva OC, se debe seleccionarotro y trazar su curva OC.

Curva característica de operación para planes de muestreo (CO)

Ingeniería de Calidad 2021

Curva característica de operación para planes de muestreo (CO)

Ingeniería de Calidad 2021

En una relación cliente-proveedor en la que existe un plan de muestreode aceptación de por medio hay dos intereses, el proveedor quiere quetodos los lotes que cumplen con un nivel de calidad aceptable seanaprobados y el cliente desea que todos los lotes que no tienen un nivelde calidad aceptable sean rechazados.

Para atender de manera parcial ambos intereses se diseñan planes demuestreo que tengan una alta probabilidad de aceptar lotes “buenos” yuna baja probabilidad de aceptar lotes “malos”.

Conceptos: Diseño para un plan de muestreo

Ingeniería de Calidad 2021

Conceptos para el diseño

Nivel de calidad aceptable (NCA) % máximo de defectuosos que el consumidorconsidera aceptable en un lote.

Riesgo del productor (α) Es la probabilidad de rechazar lotes con un nivel decalidad aceptable.

Nivel de calidad límite (NCL) % de defectuosos en un lote que el consumidorconsidera no satisfactorio y quiere que se rechace con alta probabilidad.

Riesgo del consumidor (β) Es la probabilidad de aceptar lotes con calidad igualal NCL.

Ingeniería de Calidad 2021

Conceptos: Diseño para un plan de muestreo

Ingeniería de Calidad 2021

Calidad promedio de salida (CPS o AOQ) Es el nivel promedio decalidad que se alcanza al aplicar un programa de inspección paradeterminada calidad de entrada.

p es la proporción de defectuosos a la entrada del lotePa Probabilidad de aceptación

• Cuando un programa de muestreo de aceptación aplica muestreo de100% a los lotes rechazados, la calidad de salida de esos lotes esperfecta (si no hay error de inspección), ya que todas las unidadesdefectuosas de éstos son sustituidas por artículos buenos. En los lotesaceptados es probable que su calidad de salida después de lainspección mejore, porque las unidades defectuosas encontradas enla muestra son reemplazadas. De esta manera, independientementede si el lote es aceptado o rechazado, la calidad que llega al clientetiende a ser mejor.

• Límite de la calidad promedio de salida (LCPS o AOQL) Representa lapeor calidad promedio que resultaría del programa de inspección,independientemente de la calidad de entrada.

Conceptos para el diseñoIngeniería de Calidad 2021

• Inspección total promedio (ITP o ATI) Es el número promedio deartículos que se inspeccionan por lote, considerando los aceptados(n) y los rechazados (N).

• Con estos conceptos es posible graficar las curvas representandoclaramente el riesgo que asume cada parte del acuerdo cliente-proveedor.

• Existen diseños de planes de muestreo que regulan de forma lógica larelación cliente-proveedor como el método de Cameron, MilitaryStandard 105E, Dodge-Roming, Planes NCL (o LTPD), Planes LCPS (oAOQL), entre otros. Para graficar las curvas CO se puede emplear lossoftware Excel y Statgraphics.

Conceptos para el diseñoIngeniería de Calidad 2021

ANEXOSIngeniería de Calidad 2021

ANEXO PROMEDIO

• Datos no agrupados. Esta técnica se usa cuando los datos no estánorganizados. El promedio se representa con la notación que se lee“equis barra” y se define con

• Datos agrupados. Cuando se han agrupado los datos en unadistribución de frecuencias, se aplica la técnica siguiente. La fórmulapara el promedio de datos agrupados es:

• Promedio ponderado. Cuando se combinan varios promedios condiferentes frecuencias, se calcula un promedio ponderado. La fórmuladel promedio ponderado es la siguiente:

ANEXO PROMEDIO

ANEXO MEDIANA• Técnica para datos no agrupados: Los números debe estar ordenados.

Puede ocurrir que sea una cantidad par, la mediana es el promedio delos dos números a la mitad. Así, el conjunto ordenado de números 3,4, 5, 6, 8 y 8 tiene una mediana que es el promedio de 5 y 6, que es (5+ 6) / 2 = 5.5.

• Para la serie impar, la mediana es el punto medio de los valores.Entonces, el conjunto ordenado de números 3, 4, 5, 6, 8, 8 y 10 tienesu mediana en 6.

• Técnica para datos agrupados: La fórmula de interpolación paracalcular la mediana es:

ANEXO DESVIACIÓN ESTÁNDAR

Técnica para datos no agrupados: La fórmula con que se definió ladesviación estándar se puede usar con los datos no agrupados. Sinembargo, una fórmula alternativa es más adecuada.

Técnica para datos agrupados: Cuando los datos se agruparon en unadistribución de frecuencias se puede aplicar la siguiente técnica.

• Cuantiles Medidas de localización que separan por magnitud unconjunto de datos en cierto número de grupos o partes quecontienen la misma cantidad de datos. Por ejemplo, los decilesdividen los datos en 10 grupos.

• Percentil p En ciertos datos es igual a un valor x tal que el p% de las mediciones es menor o igual a x.

• Cuartiles Son iguales a los percentiles 25, 50 y 75, y sirven paraseparar por magnitud la distribución de unos datos en cuatro grupos,donde cada uno contiene 25% de los datos.

ANEXO: OTRAS MEDIDAS

Anexo: Diagrama de cajaDatos: la edad de 20 personas

Datos ordenados

Q1 es el valor mayor que el 25% de los valores. Como N es 20 resulta que N/4 es5; el primer cuartil es la media aritmética de dicho valor y el siguiente: Q1=(24 +25) / 2 = 24,5

Q2 es el valor de la variable que ocupa el lugar central en un conjunto de datosordenados. Como N/2 =10 ; la mediana es la media aritmética de dicho valor yel siguiente: me= Q2 = (33 + 34)/ 2 = 33,5

Q3 es el valor que sobrepasa al 75% de los valores de la distribución. Como3N/4 = 15, resulta Q2=(39 + 39) / 2 = 39

Ejemplo completo paso a paso: https://www.estadisticaparatodos.es/taller/graficas/cajas.html

ANEXO: OTRAS MEDIDAS

• Asimetría es la carencia de simetría de los datos

• Si el valor de a3 es 0, los datos son simétricos; si es mayor que 0(positiva), los datos son asimétricos hacia la derecha; eso quiere decirque la cola más larga es la del lado derecho. Si la asimetría es menorque 0 (negativa), los datos son asimétricos hacia la izquierda; quieredecir que la cola más larga está en el lado izquierdo.

• Curtosis medida de la altura del pico en una distribución.

• Coeficiente de variación medida de cuánta variación existe enrelación con la media, proporciona una referencia.

ANEXO: OTRAS MEDIDAS

Bibliografía

• Dale H. Besterfield (2009) Control de calidad. Octava edición. Pearson Educación. México. ISBN: 978-607-442-121-7

• Humberto Gutiérrez Pulido, Román de la Vara Salazar (2009) Control estadístico de calidad y seis sigma.Segunda edición. McGRAW-HILL/INTERAMERICANA EDITORES, S.A. México. ISBN: 978-970-10-6912-7

• Figuras media, mediana y moda URL: https://es.slideshare.net/jpgv84/estadstica-descriptiva-presentation-882182

• Figura diagrama de caja URL: https://www.universoformulas.com/estadistica/descriptiva/diagrama-caja/

• Roberto Carro Paz, Daniel González Gómez (s/d). Administración de las operaciones. Facultad de CienciasEconómicas y Sociales. Universidad Nacional de Mar del Plata