análisis de capacidad multivariada

15
STATGRAPHICS – Rev. 4/d/yyyy © 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 1 Análisis de Capacidad Multivariada Resumen El procedimiento Análisis de Capacidad Multivariada determina la probabilidad de que los puntos caracterizados por dos o más variables se encuentren establecidos dentro de los límites de especificación. Cuando las variables están correlacionadas, es importante considerar el comportamiento conjunto, ya que al observar cada variable separadamente puede dar un panorama erróneo de la capacidad de proceso general. StatFolio Muestra: mvcapability.sgp Datos Muestra: El archivo grit.sf3 contiene mediciones realizadas de n = 56 montones de “gravilla”, de Holmes y Mergen (1993). Los datos representan los porcentajes de partículas grandes, medianas y pequeñas en la gravilla. La siguiente tabla muestra una lista parcial de los datos en este archivo: Large (Grande) Médium (Mediana) Small (Pequeña) LSL Nominal USL 5.4 93.6 1.0 5 10 3.2 92.6 4.2 5 10 5.2 91.7 3.1 3.5 86.9 9.6 2.9 90.4 6.7 4.6 92.1 3.3 4.4 91.5 4.1 5,0 90.3 4.7 8.4 85.1 6.5 4.2 89.7 6.1 3.8 92.5 3.7 4.3 91.8 3.9 3.7 91.7 4.6 3.8 90.3 5.9 2.6 94.5 2.9 Además de la muestra, el archivo también contiene límites de especificación para los porcentajes relativos de partículas grandes y pequeñas, los cuales son: Grande 10% (1) Pequeña 10% (2) Note que la columna que contiene los límites inferiores está en blanco, ya que no hay cotas inferiores. Se desea estimar el porcentaje de montones que se encuentran dentro de los límites de especificación.

Upload: justorfc

Post on 10-Jun-2015

1.339 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Análisis de Capacidad Multivariada

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 1�

Análisis de Capacidad Multivariada Resumen El procedimiento Análisis de Capacidad Multivariada determina la probabilidad de que los puntos caracterizados por dos o más variables se encuentren establecidos dentro de los límites de especificación. Cuando las variables están correlacionadas, es importante considerar el comportamiento conjunto, ya que al observar cada variable separadamente puede dar un panorama erróneo de la capacidad de proceso general. StatFolio Muestra: mvcapability.sgp Datos Muestra: El archivo grit.sf3 contiene mediciones realizadas de n = 56 montones de “gravilla”, de Holmes y Mergen (1993). Los datos representan los porcentajes de partículas grandes, medianas y pequeñas en la gravilla. La siguiente tabla muestra una lista parcial de los datos en este archivo:

Large (Grande)

Médium (Mediana)

Small (Pequeña)

LSL Nominal USL

5.4 93.6 1.0 5 10 3.2 92.6 4.2 5 10 5.2 91.7 3.1 3.5 86.9 9.6 2.9 90.4 6.7 4.6 92.1 3.3 4.4 91.5 4.1 5,0 90.3 4.7 8.4 85.1 6.5 4.2 89.7 6.1 3.8 92.5 3.7 4.3 91.8 3.9 3.7 91.7 4.6 3.8 90.3 5.9 2.6 94.5 2.9

Además de la muestra, el archivo también contiene límites de especificación para los porcentajes relativos de partículas grandes y pequeñas, los cuales son: Grande ≤ 10% (1)

Pequeña ≤ 10% (2) Note que la columna que contiene los límites inferiores está en blanco, ya que no hay cotas inferiores. Se desea estimar el porcentaje de montones que se encuentran dentro de los límites de especificación.

Page 2: Análisis de Capacidad Multivariada

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 2�

Entrada de Datos Los datos que serán analizados consisten en columnas numéricas las cuales contienen las variables de interés y los limites de especificación.

• Datos: columnas numéricas que contienen las n muestras, una por renglón. • Límites Superiores de Especificación: columna numérica que contiene los límites de

especificación superiores. Si una variable no tiene un límite superior, deje la celda correspondiente en blanco.

• Valores Nominales: columna numérica que contiene los valores nominales u objetivos para

cada variable. Si una variable no tiene un valor objetivo, deje la celda correspondiente en blanco.

• Limites Inferiores de Especificación: columna numérica que contiene los límites de

especificación inferior. Si una variable no tiene un límite inferior, deje la celda correspondiente en blanco.

• Selección: Subconjunto a seleccionar.

Page 3: Análisis de Capacidad Multivariada

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 3�

Resumen del Análisis El Resumen del Análisis muestra los estadísticos resumidos para cada columna y la probabilidad estimada de estar fuera de los límites de especificación. Análisis de Capacidad Multivariada Datos / Variables: Small Large Número de casos completos: 56

Media Desv. Estd. Variable Muestral Muestral LIE Nominal LSE Small 6.09821 2.51154 5.0 10.0 Large 5.68214 1.94171 5.0 10.0

Page 4: Análisis de Capacidad Multivariada

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 4�

Se incluye en la tabla:

• Número de Casos Completos: el número de renglones n en el archivo de datos con información en las p variables. Cualquier renglón con datos faltantes para alguna variable es excluido del análisis.

• Media Muestral y Desviación Estándar: la media muestral y la desviación estándar para cada variable.

• Observado Fuera de la Especificación: el porcentaje de muestras en las cuales cada variable estuvo fuera de sus límites de especificación individual, con el porcentaje de veces en las cuales las muestras estuvieron conjuntamente fuera de los límites. El porcentaje conjunto incluye casos en los cuales una o más variables estuvieron fuera de sus límites individuales.

• Estimado Fuera de la Especificación: el porcentaje de muestras similares en la población que se estiman están fuera de los límites de especificación. La estimación está basada en una distribución normal multivariada de los datos y en la estimación del área de esa distribución que no está dentro de los límites de especificación de la distribución conjunta.

• Estimado DPM: los “defectos por millón” estimados, definidos como el número de muestras fuera, de cada millón que se estima que caerán fuera de los límites de especificación. Esto se calcula a partir del Estimado Fuera de la Especificación.

Fuera Especs. Fuera Especs. DPM Variable Observados Estimados Estimados Small 5.35714% 6.01462% 60146.2 Large 1.78571% 1.30827% 13082.7 Conjunto 7.14286% 7.18235% 71823.5

Page 5: Análisis de Capacidad Multivariada

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 5�

En el ejemplo, las muestras de arena violaron uno o más límites de especificación 7.14% de las veces. Basados en la distribución normal multivariada, se estima que el 7.91% de todas las muestras tomadas de la población estarían conjuntamente fuera de la especificación. Debería notarse que la probabilidad conjunta no es la suma de las probabilidades individuales. NOTA: el cálculo del porcentaje estimado conjunto fuera de la especificación requiere integrar una distribución normal multivariada y esto puede consumir mucho tiempo. Por favor tenga paciencia. También, note que para derivar el porcentaje se usan métodos Monte Carlo, así que la respuesta podría variar un poco de la que se mostró anteriormente si el proceso se realiza nuevamente.

Gráfica de Capacidad La Gráfica de Capacidad muestra la distribución normal multivariada para cualesquiera 2 de las variables.

Greáfica de Capabilidad Multivariada DPM = 71823.5

0 3 6 9 12 15Small

0 2 4 6 8 1012

Large

El área sombreada en azul corresponde a la ubicación donde todas las variables están dentro de los límites de especificación. El área sombreada en rojo corresponde a la ubicación de una o más variables que se encuentran fuera de la especificación.

Page 6: Análisis de Capacidad Multivariada

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 6�

Panel de Opciones

• Seleccione 2 Variables: seleccione dos de las p variables. Se mostrará la distribución

marginal de las 2 variables seleccionadas. • Invertir Variables: seleccione esta opción para mostrar la segunda variable a lo largo del eje

X en el frente de la gráfica. En otro caso, la primera variable será graficada a lo largo del eje X.

Índices de Capacidad Esta tabla muestra los índices de capacidad calculados de los datos.

Índices de Capacidad

Page 7: Análisis de Capacidad Multivariada

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 7�

Basados en límites 6.0 sigma. El Nivel de Calidad Sigma incluye un drif en la media de 1.5 sigmas.

Los índices calculados son:

• DPM – defectos estimados por millón. Éste es el número estimado de las muestras tomadas de la población que estarían fuera de la especificación en una o más de las variables.

• MCP – un índice de capacidad multivariada. El índice es calculado por

2/kZMCP = (3)

donde Z es el valor de la variable aleatoria normal estándar correspondiente a los DPM calculados, y k es el múltiplo de sigma especificado en la tabla Capacidad del cuadro de diálogo Preferencias, accesible desde el menú Editar. Normalmente, k = 6. Este índice está diseñado para tener una interpretación similar a Cpk en el caso univariado. Usualmente, esto es deseable para MCP ≥ 1.33.

• MCR – el radio de capacidad multivariado. El índice es calculado por

%2/100Z

kMCR = (4)

Esto es básicamente el inverso de MCP y expresa el porcentaje de la variación permisible que está siendo consumida por la variabilidad en los datos.

• Z – el valor de la variable aleatoria normal estándar correspondiente al valor calculado

DPM.

Índice Estimado MCP 0.49 MCR 205.15 DPM 71823.5 Z 1.46235 SQL 2.96235

Page 8: Análisis de Capacidad Multivariada

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 8�

• SQL – el Nivel de Calidad Sigma estimado. Este es un índice del nivel de calidad para el proceso desarrollado como parte del proceso Six Sigma. Dependiendo de la elección 1.5 Sigma Shift en la tabla Capacidad del cuadro de diálogo Preferencias, el SQL es igual a Z o (Z+1.5).

Los datos muestra tienen un índice de capacidad de MCP = 0.49, correspondiente a un nivel de calidad sigma de aproximadamente 3. Mientras que estos niveles obtenidos son comunes, lograr una calidad de clase mundial requeriría mejorar la consistencia de los procesos.

Elipse de Capacidad La Elipse de Capacidad muestra un diagrama bidimensional de las estimaciones realizadas de los procesos con respecto a 2 variables elegidas.

99.73% Elipse de CapabilidadMCP =0.49

-3 0 3 6 9 12 15Small

-1

2

5

8

11

14

Larg

e

La elipse es dibujada de tal forma que incluye el 99.73% de la probabilidad normal multivariada estimada para las variables elegidas, similar a los límites sigma ± 3 en una gráfica de capacidad univariada. La región rectangular es la ubicación en la cual ambas variables están dentro de sus límites de especificación. Un proceso “capaz” contendría completamente la elipse dentro de la región rectangular.

Page 9: Análisis de Capacidad Multivariada

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 9�

Panel de Opciones

• Seleccione 2 Variables: seleccione dos de las p variables. • Invertir Variables: seleccione esta opción para mostrar la segunda variable a lo largo del eje

X. En otro caso, la primera variable será graficada a lo largo del eje X.

Matriz de Correlación Esta tabla muestra los coeficientes de correlación estimados para cada par de variables:

Matriz de Correlación

Page 10: Análisis de Capacidad Multivariada

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 10�

Los coeficientes de correlación miden la fuerza de la relación lineal entre un par de variables, en una escala de –1 para una correlación negativa perfecta a +1 para una correlación positiva perfecta. Entre más altas sean las correlaciones es más importante analizar las variables conjuntamente en lugar de hacer un análisis de capacidad univariado para cada variable.

Small Large Small 1.0000 0.3538 Large 0.3538 1.0000

Page 11: Análisis de Capacidad Multivariada

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 11�

Pruebas de Normalidad El proceso de capacidad estimado que se mostró anteriormente depende en gran parte de suponer que los datos siguen una distribución normal multivariada. El panel Pruebas de Normalidad realiza una o más pruebas en cada variable para determinar cuando o no una distribución normal es un modelo razonable para la variable. Para cada prueba, las hipótesis de interés son:

• Hipótesis Nula: los datos son muestras independientes de una distribución normal • Hipótesis Alternativa: los datos no son muestras independientes de una distribución

normal

Prubas de Normalidad Valores-P

Las pruebas a realizarse se seleccionan utilizando el Panel de Opciones. Cada prueba es desplegada con sus estadísticos de prueba asociados y su P-Valor. P-Valores pequeños (por debajo de 0.05 si se trabaja con un nivel de significancia del 5% ) permiten un rechazo de la hipótesis nula y entonces un rechazo de la distribución normal. En la tabla anterior, todos los P-Valores están por encima de 0.05, así que estadísticamente no existe una anormalidad significativa en los datos. Panel de Opciones

Shapiro-Wilk Sesgo Curtosis Small 0.755982 0.382035 0.504427 Large 0.314548 0.470987 0.721277

Page 12: Análisis de Capacidad Multivariada

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 12�

Incluir – seleccione la prueba que se incluirá en la salida . Las pruebas por defecto son definidas en la tabla Dist. Fit del cuadro de diálogo Preferencias al cual se tiene acceso desde el menú Editar.

Page 13: Análisis de Capacidad Multivariada

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 13�

Gráfica de Probabilidad La Gráfica de Probabilidad es otro método por el cual se puede juzgar cuándo la distribución seleccionada describe adecuadamente los datos o no.

Gráfica de Probabilidad

-2.1 -1.1 -0.1 0.9 1.9 2.9 3.9distribución normal

-2.1

-1.1

-0.1

0.9

1.9

2.9

3.9

dato

s em

píric

os

SmallLarge

La gráfica muestra los valores de los datos para cada variable, ordenados de mayor a menor, graficados contra los percentiles equivalentes de la distribución normal seleccionada. Si la distribución normal es un modelo razonable para los datos, los puntos estarán aproximadamente a lo largo de una línea recta. En general, la gráfica anterior confirma que la distribución normal es un modelo razonable.

Diagrama T-Cuadrada Como en todos los análisis de capacidad, es importante que el proceso se encuentre en un estado de control estadístico cuando la capacidad es estimada. En el caso de datos multivariados, un Diagrama T-Cuadrada es útil para examinar si los datos fueron mostrados de un proceso de control.

Page 14: Análisis de Capacidad Multivariada

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 14�

Carta de Control T-Cuadrada

0 10 20 30 40 50 60Observación

0

2

4

6

8

10

12T-

Cua

drad

aLSC = 10.81

En un diagrama T-Cuadrada, cada muestra es representada por un solo estadístico definido por

)()( 12 xxSxxT iii −′−= − (5) donde xi es el vector de los valores observados correspondientes a la i-ésima muestra, x es el vector de las medias muestrales, y S es la matriz de covarianzas de la muestra. Se incluye un límite superior de control en el diagrama, colocado por defecto para cubrir el 99.73% de una distribución normal multivariada con las medias y las covarianzas estimadas. Cualquier punto fuera del limite de control sería una señal de una situación potencialmente fuera-de-control. Panel de Opciones

• Alfa: la probabilidad de falsa alarma del diagrama de control. Para un diagrama de control

estándar 3-sigma, α = 0.27%. • Cifras Decimales para Límites: el número de lugares decimales para mostrar los límites de

control. • Colorear Zonas: seleccione esta opción para mostrar zonas verdes y rojas.

Page 15: Análisis de Capacidad Multivariada

STATGRAPHICS – Rev. 4/d/yyyy

© 2006 por StatPoint, Inc. Análisis de Capabilidad Multivariada - 15�

Cálculos Vector de la Media de la Muestra Vector p por 1 con elementos:

∑=

=n

iijj x

nx

1

1 (6)

Matriz de Covarianza de la Muestra Matriz p por p con elementos:

( )( )kik

n

ijijjk xxxx

ns −−

−= ∑

=111

(7)

Límites de Control en el Diagrama T-Cuadrada

2/)1(,2/,

2)1(−−

−= pnpBeta

nnUCL α (8)