sistemas de soporte para la toma de decisiones
Post on 01-Jan-2016
47 Views
Preview:
DESCRIPTION
TRANSCRIPT
Producción Industrial
SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES
2
Análisis de varianza (ANOVA)
El Análisis de Varianza es una prueba de hipótesis que trata de probar la igualdad de varias medias al mismo tiempo:
Requiere que las poblaciones sean normales y con varianza similar.
ANOVA de una vía con datos de tratamientos en diferentes columnas:
Ejemplo: Los técnicos de una fábrica de papel hacen un experimento de un factorpara ver que variedad de árbol produce menos fenoles en los desechos de pasta depapel. Se colectan los siguientes datos en porcentajes:A un 95% de nivel de confianza, ¿hay alguna variedad que produzca más fenoles que otra?
Se colocan los datos en tres columnas distintas:
kH ....3210
.:1 diferentessonmediasdosmenosAlH
3
Instrucciones de Minitab:Stat > ANOVA > One Way (Unstacked)
OK
IR aEstadistica_ANOVA_Un solo Factor_DesapiladoRespuestas en columnas Separadas A B CNivel de Confianza: 95Comparaciones: Tukey Tasa de error por familiaGráficos: Diagrama de Cajas de Datos y Gráfica Normal de Residuos OK
4
Los resultados se muestran a continuación:Como el valor P value es menor
One-way ANOVA: A, B, C a 0.05 existe una diferencia significativa entre algunas medias
Source DF SS MS F PFactor 2 0.9000 0.4500 8.44 0.005Error 12 0.6400 0.0533Total 14 1.5400S = 0.2309 R-Sq = 58.44% R-Sq(adj) = 51.52%
Individual 95% CIs For Mean Based on Pooled StDevA produce más fenoles que B,CLevel N Mean StDev ----+---------+---------+---------+-----A 4 1.9000 0.1414 (-------*--------)B 5 1.3000 0.2121 (------*-------)C 6 1.4000 0.2828 (------*------) ----+---------+---------+---------+----- 1.20 1.50 1.80 2.10
Pooled StDev = 0.2309 Las medias B y C La media de A esDesviación estándar poblacional son similares diferente a B y C
5
Tukey 95% Simultaneous Confidence IntervalsAll Pairwise Comparisons
Individual confidence level = 97.94% Como el cero no está en elintervalo de la diferencia B-A
A subtracted from: o C-A, A es diferente de B y C Lower Center Upper -----+---------+---------+---------+----B -1.0130 -0.6000 -0.1870 (---------*---------)C -0.8974 -0.5000 -0.1026 (---------*--------) -----+---------+---------+---------+---- -0.80 -0.40 -0.00 0.40
B subtracted from: Lower Center Upper -----+---------+---------+---------+----C -0.2728 0.1000 0.4728 (---------*--------) -----+---------+---------+---------+---- -0.80 -0.40 -0.00 0.40
El intervalo de la diferencia C-B si incluyeel cero por tanto B no es diferentes de C
6
CBA
2.2
2.0
1.8
1.6
1.4
1.2
1.0
Data
Boxplot of A, B, C
Los resultados gráficos son los siguientes:
Se observa que la media de A es diferente a las medias de B y C (si se superpone B y C tienen elementos comunes y son iguales)Los árboles B y C producen menos cantidad de fenoles.
7
Los resultados gráficos son los siguientes:
0.500.250.00-0.25-0.50
99
95
90
80
70
605040
30
20
10
5
1
Residual
Perc
entNormal Probability Plot
(responses are A, B, C)
Los residuos o errores se apegan a la recta normal, por tantoel modelo ANOVA es un modelo adecuado para los datos
8
ANOVA de una vía con datos de tratamientos en una sola columna
Los datos del ejemplo anterior se arreglan en doscolumnas como se muestran a continuación: Fenoles Árbol
1.9 AA B C 1.8 A
1.9 1.6 1.3 2.1 A1.8 1.1 1.6 1.8 A2.1 1.3 1.8 1.6 B1.8 1.4 1.1 1.1 B
1.1 1.5 1.3 B1.1 1.4 B
1.1 B1.3 C1.6 C1.8 C1.1 C1.5 C1.1 C
9
Instrucciones de Minitab:Estadistica> ANOVA > Un solo Factor
Respuestas Fenoles Factor Árbol Nivel deConfidanzal 95Comparaciones Tukey's, : 5Graficos: Residuos De cajas y Normal de ResiduosOK
Los resultados que se obtienen son iguales a los ejemplo anterior.
10
Ejercicios:Las calificaciones de un curso de liderazgo para 18 participantes de tres diferentes departamentos fueron las mostradas en la tabla siguiente. Probar a un 95% de nivel de confianza o 5% de nivel de significancia si el aprovechamiento fue similar en los tres departamentos
o en su caso cuál fue el peor.
DEPARTAMENTO Arreglados en dos columnas quedan como:Depto_A Depto_B Depto_C Calificaciones Depto
8 7 5 8 Depto_A7 8 6 7 Depto_A8 7 6 8 Depto_A6 7 7 6 Depto_A7 6 7 7 Depto_A8 8 6 8 Depto_A
7 Depto_B8 Depto_B7 Depto_B7 Depto_B6 Depto_B8 Depto_B5 Depto_C6 Depto_C6 Depto_C7 Depto_C7 Depto_C6 Depto_C
Curso básico de Minitab
Estadística no paramétrica
11
Curso básico de Minitab
Regresión lineal y cuadrática
12
13
Correlación y Regresión lineal y cuadrática simple
Coeficiente de Correlación
Establece si existe una relación entre las variables y responde a la pregunta,”¿Qué tan evidente es esta relación?".
La correlación es una prueba fácil y rápida para eliminar factores que no influyen en la predicción, para una respuesta dada.
* Es una medida de la fuerza de la relación lineal entre dos variables x y y.* Es un número entre -1 y 1* Un valor positivo indica que cuando una variable aumenta, la otra variable aumenta* Un valor negativo indica que cuando una variable aumenta, la otra disminuye* Si las dos variables no están relacionadas, el coeficiente de correlación tiende a 0.
14
Correlación PositivaEvidente
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
Correlación NegativaEvidente
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
CorrelaciónPositiva
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
CorrelaciónNegativa
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
Sin Correlación
10
15
20
25
5 10 15 20 25
X
Y0
5
0
Correlación PositivaEvidente
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
Correlación NegativaEvidente
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
CorrelaciónPositiva
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
CorrelaciónNegativa
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
Sin Correlación
10
15
20
25
5 10 15 20 25
X
Y0
5
0
r = 1
r = 0.8 r = -0.8
r = -1
r = 0
15
Ejemplo:Se utiliza el archivo PULSE.MTW campos Peso (Weight) y Altura (Height)
Archivo > Abrir hoja de trabajo> Pulso.Mtw
Antes de calcular el coeficiente de correlación se sugiere hacer un diagramabivariante para identificar posibles valores anómalos, relaciones no lineales, etc.
Grafica > Disperción: Simple Y = Peso y X = Altura
Height
Weig
ht
767472706866646260
220
200
180
160
140
120
100
Scatterplot of Weight vs Height
16
Ahora se calcula el coeficiente de Correlación que mide el grado de relación que existeentre dos variables, como sigue:
Estadistica > Estadistica Básica > CorrelacionSeleccionar en Variables Peso Altura Seleccionar Presentar Valores de p
Los resultados son los siguientes:
Correlations: Weight, Height Pearson correlation of Weight and Height = 0.785
Coeficiente de correlación
P-Value = 0.000Como el P value es menor a 0.05, la correlación si es significativa
17
Curso básico de Minitab
Coeficiente de correlación
Coeficiente de correlación0.8 < r < 1.00.3 < r < 0.8-0.3 < r < 0.3-0.8 < r < -0.3-1.0 < r < -0.8
RelaciónFuerte, positivaDébil, positiva
No existeDébil, negativa
Fuerte, negativa
Reglas empíricas
18
Análisis de Regresión
El análisis de regresión es un método estandarizado para localizar la correlación entre dos grupos de datos, y, quizá más importante, crear un modelo de predicción.
Puede ser usado para analizar las relaciones entre:• Una sola “X” predictora y una sola “Y”
• Múltiples predictores “X” y una sola “Y”
• Varios predictores “X” entre sí
El análisis de regresión es un método estandarizado para localizar la correlación entre dos grupos de datos, y, quizá más importante, crear un modelo de predicción.
Puede ser usado para analizar las relaciones entre:• Una sola “X” predictora y una sola “Y”
• Múltiples predictores “X” y una sola “Y”
• Varios predictores “X” entre sí
19
Modelo de regresión lineal simple
7060504030
80
75
70
65
60
55
50
Tiempo de estudio (horas)
Resu
ltados
de p
rueba (
%)
S 4.47182R-Sq 77.0%R-Sq(adj) 74.2%
Fitted Line PlotResultados de prueba (%) = 31.21 + 0.6955 Tiempo de estudio (horas)
Mínimos cuadrados
R^2 Coef. de determinación
20
Regresión simple por medio de gráfica:
File > Open Worksheet > Pulse.MtwStat > Regression > Fitted line PlotSeleccionar en Response (Y) Weight y en Predictor (X) HeightSeleccionar modelo Type of Regression model LinearSel. en Graphs > Residuals Standardized > Normal Plot y Residuals vs fitsOK
Ecuación deRegresión
S Desv. Estandar delos residuos(valor real-estimadopor la regresión)
R-Sq Coeficientede Determinaciónen porcentaje de variación explicadapor la ecuación deregresión
R-Sq (Adj) - Sólo para regresión múltiple
Height
Weig
ht
767472706866646260
220
200
180
160
140
120
100
S 14.7920R-Sq 61.6%R-Sq(adj) 61.2%
Fitted Line PlotWeight = - 204.7 + 5.092 Height
21
Regression Analysis: Weight versus Height
The regression equation isWeight = - 204.7 + 5.092 HeightS = 14.7920 R-Sq = 61.6% R-Sq(adj) = 61.2%
Analysis of VarianceSource DF SS MS F PRegression 1 31591.6 31591.6 144.38 0.000Error 90 19692.2 218.8Total 91 51283.9
El valor p menor a 0.05 indica que SIes significativa la Correlación de Y y X.
22
Análisis de los residuos
Los residuos muestran aleatoriedad Los residuos siguen una distribución normal
180170160150140130120110100
4
3
2
1
0
-1
-2
Fitted Value
Sta
nd
ard
ize
d R
esi
du
al
Versus Fits(response is Weight)
43210-1-2-3-4
99.9
99
95
90
80706050403020
10
5
1
0.1
Standardized Residual
Pe
rce
nt
Normal Probability Plot(response is Weight)
top related