sistemas de soporte para la toma de decisiones

Producción Industrial

SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

Análisis de varianza (ANOVA)

El Análisis de Varianza es una prueba de hipótesis que trata de probar la igualdad de varias medias al mismo tiempo:

Requiere que las poblaciones sean normales y con varianza similar.

ANOVA de una vía con datos de tratamientos en diferentes columnas:

Ejemplo: Los técnicos de una fábrica de papel hacen un experimento de un factorpara ver que variedad de árbol produce menos fenoles en los desechos de pasta depapel. Se colectan los siguientes datos en porcentajes:A un 95% de nivel de confianza, ¿hay alguna variedad que produzca más fenoles que otra?

Se colocan los datos en tres columnas distintas:

kH ....3210

.:1 diferentessonmediasdosmenosAlH

Instrucciones de Minitab:Stat > ANOVA > One Way (Unstacked)

IR aEstadistica_ANOVA_Un solo Factor_DesapiladoRespuestas en columnas Separadas A B CNivel de Confianza: 95Comparaciones: Tukey Tasa de error por familiaGráficos: Diagrama de Cajas de Datos y Gráfica Normal de Residuos OK

Los resultados se muestran a continuación:Como el valor P value es menor

One-way ANOVA: A, B, C a 0.05 existe una diferencia significativa entre algunas medias

Source DF SS MS F PFactor 2 0.9000 0.4500 8.44 0.005Error 12 0.6400 0.0533Total 14 1.5400S = 0.2309 R-Sq = 58.44% R-Sq(adj) = 51.52%

Individual 95% CIs For Mean Based on Pooled StDevA produce más fenoles que B,CLevel N Mean StDev ----+---------+---------+---------+-----A 4 1.9000 0.1414 (-------*--------)B 5 1.3000 0.2121 (------*-------)C 6 1.4000 0.2828 (------*------) ----+---------+---------+---------+----- 1.20 1.50 1.80 2.10

Pooled StDev = 0.2309 Las medias B y C La media de A esDesviación estándar poblacional son similares diferente a B y C

Tukey 95% Simultaneous Confidence IntervalsAll Pairwise Comparisons

Individual confidence level = 97.94% Como el cero no está en elintervalo de la diferencia B-A

A subtracted from: o C-A, A es diferente de B y C Lower Center Upper -----+---------+---------+---------+----B -1.0130 -0.6000 -0.1870 (---------*---------)C -0.8974 -0.5000 -0.1026 (---------*--------) -----+---------+---------+---------+---- -0.80 -0.40 -0.00 0.40

B subtracted from: Lower Center Upper -----+---------+---------+---------+----C -0.2728 0.1000 0.4728 (---------*--------) -----+---------+---------+---------+---- -0.80 -0.40 -0.00 0.40

El intervalo de la diferencia C-B si incluyeel cero por tanto B no es diferentes de C

Boxplot of A, B, C

Los resultados gráficos son los siguientes:

Se observa que la media de A es diferente a las medias de B y C (si se superpone B y C tienen elementos comunes y son iguales)Los árboles B y C producen menos cantidad de fenoles.

Los resultados gráficos son los siguientes:

0.500.250.00-0.25-0.50

605040

Residual

entNormal Probability Plot

(responses are A, B, C)

Los residuos o errores se apegan a la recta normal, por tantoel modelo ANOVA es un modelo adecuado para los datos

ANOVA de una vía con datos de tratamientos en una sola columna

Los datos del ejemplo anterior se arreglan en doscolumnas como se muestran a continuación: Fenoles Árbol

1.9 AA B C 1.8 A

1.9 1.6 1.3 2.1 A1.8 1.1 1.6 1.8 A2.1 1.3 1.8 1.6 B1.8 1.4 1.1 1.1 B

1.1 1.5 1.3 B1.1 1.4 B

1.1 B1.3 C1.6 C1.8 C1.1 C1.5 C1.1 C

Instrucciones de Minitab:Estadistica> ANOVA > Un solo Factor

Respuestas Fenoles Factor Árbol Nivel deConfidanzal 95Comparaciones Tukey's, : 5Graficos: Residuos De cajas y Normal de ResiduosOK

Los resultados que se obtienen son iguales a los ejemplo anterior.

Ejercicios:Las calificaciones de un curso de liderazgo para 18 participantes de tres diferentes departamentos fueron las mostradas en la tabla siguiente. Probar a un 95% de nivel de confianza o 5% de nivel de significancia si el aprovechamiento fue similar en los tres departamentos

o en su caso cuál fue el peor.

DEPARTAMENTO Arreglados en dos columnas quedan como:Depto_A Depto_B Depto_C Calificaciones Depto

8 7 5 8 Depto_A7 8 6 7 Depto_A8 7 6 8 Depto_A6 7 7 6 Depto_A7 6 7 7 Depto_A8 8 6 8 Depto_A

7 Depto_B8 Depto_B7 Depto_B7 Depto_B6 Depto_B8 Depto_B5 Depto_C6 Depto_C6 Depto_C7 Depto_C7 Depto_C6 Depto_C

Curso básico de Minitab

Estadística no paramétrica

Regresión lineal y cuadrática

Correlación y Regresión lineal y cuadrática simple

Coeficiente de Correlación

Establece si existe una relación entre las variables y responde a la pregunta,”¿Qué tan evidente es esta relación?".

La correlación es una prueba fácil y rápida para eliminar factores que no influyen en la predicción, para una respuesta dada.

* Es una medida de la fuerza de la relación lineal entre dos variables x y y.* Es un número entre -1 y 1* Un valor positivo indica que cuando una variable aumenta, la otra variable aumenta* Un valor negativo indica que cuando una variable aumenta, la otra disminuye* Si las dos variables no están relacionadas, el coeficiente de correlación tiende a 0.

Correlación PositivaEvidente

0 5 10 15 20 25

Correlación NegativaEvidente

0 5 10 15 20 25

CorrelaciónPositiva

0 5 10 15 20 25

CorrelaciónNegativa

0 5 10 15 20 25

Sin Correlación

5 10 15 20 25

Correlación PositivaEvidente

0 5 10 15 20 25

Correlación NegativaEvidente

0 5 10 15 20 25

CorrelaciónPositiva

0 5 10 15 20 25

CorrelaciónNegativa

0 5 10 15 20 25

Sin Correlación

5 10 15 20 25

r = 0.8 r = -0.8

r = -1

Ejemplo:Se utiliza el archivo PULSE.MTW campos Peso (Weight) y Altura (Height)

Archivo > Abrir hoja de trabajo> Pulso.Mtw

Antes de calcular el coeficiente de correlación se sugiere hacer un diagramabivariante para identificar posibles valores anómalos, relaciones no lineales, etc.

Grafica > Disperción: Simple Y = Peso y X = Altura

Height

767472706866646260

Scatterplot of Weight vs Height

Ahora se calcula el coeficiente de Correlación que mide el grado de relación que existeentre dos variables, como sigue:

Estadistica > Estadistica Básica > CorrelacionSeleccionar en Variables Peso Altura Seleccionar Presentar Valores de p

Los resultados son los siguientes:

Correlations: Weight, Height Pearson correlation of Weight and Height = 0.785

Coeficiente de correlación

P-Value = 0.000Como el P value es menor a 0.05, la correlación si es significativa

Coeficiente de correlación

Coeficiente de correlación0.8 < r < 1.00.3 < r < 0.8-0.3 < r < 0.3-0.8 < r < -0.3-1.0 < r < -0.8

RelaciónFuerte, positivaDébil, positiva

No existeDébil, negativa

Fuerte, negativa

Reglas empíricas

Análisis de Regresión

El análisis de regresión es un método estandarizado para localizar la correlación entre dos grupos de datos, y, quizá más importante, crear un modelo de predicción.

Puede ser usado para analizar las relaciones entre:• Una sola “X” predictora y una sola “Y”

• Múltiples predictores “X” y una sola “Y”

• Varios predictores “X” entre sí

El análisis de regresión es un método estandarizado para localizar la correlación entre dos grupos de datos, y, quizá más importante, crear un modelo de predicción.

Puede ser usado para analizar las relaciones entre:• Una sola “X” predictora y una sola “Y”

• Múltiples predictores “X” y una sola “Y”

• Varios predictores “X” entre sí

Modelo de regresión lineal simple

7060504030

Tiempo de estudio (horas)

ltados

rueba (

S 4.47182R-Sq 77.0%R-Sq(adj) 74.2%

Fitted Line PlotResultados de prueba (%) = 31.21 + 0.6955 Tiempo de estudio (horas)

Mínimos cuadrados

R^2 Coef. de determinación

Regresión simple por medio de gráfica:

File > Open Worksheet > Pulse.MtwStat > Regression > Fitted line PlotSeleccionar en Response (Y) Weight y en Predictor (X) HeightSeleccionar modelo Type of Regression model LinearSel. en Graphs > Residuals Standardized > Normal Plot y Residuals vs fitsOK

Ecuación deRegresión

S Desv. Estandar delos residuos(valor real-estimadopor la regresión)

R-Sq Coeficientede Determinaciónen porcentaje de variación explicadapor la ecuación deregresión

R-Sq (Adj) - Sólo para regresión múltiple

Height

767472706866646260

S 14.7920R-Sq 61.6%R-Sq(adj) 61.2%

Fitted Line PlotWeight = - 204.7 + 5.092 Height

Regression Analysis: Weight versus Height

The regression equation isWeight = - 204.7 + 5.092 HeightS = 14.7920 R-Sq = 61.6% R-Sq(adj) = 61.2%

Analysis of VarianceSource DF SS MS F PRegression 1 31591.6 31591.6 144.38 0.000Error 90 19692.2 218.8Total 91 51283.9

El valor p menor a 0.05 indica que SIes significativa la Correlación de Y y X.

Análisis de los residuos

Los residuos muestran aleatoriedad Los residuos siguen una distribución normal

180170160150140130120110100

Fitted Value

Versus Fits(response is Weight)

43210-1-2-3-4

80706050403020

Standardized Residual

Normal Probability Plot(response is Weight)

sistemas de soporte para la toma de decisiones

Documents

dss que ayude a la toma de decisiones de los...

toma de decisiones

soporte a la toma de decisiones - angelfire.com · apoya...

2013- tema 1 - sistemas de soporte a la toma de decisiones

sistema de inteligencia artificial como soporte a la … ·...

¡toma decisiones saludables!

toma decisiones-

diseño de un sistema para el soporte de toma de decisiones

bases de datos para el soporte en la toma de decisiones

toma decisiones

soporte a la toma de decisiones

sistema de soporte de decisiones -...

sistemas de soporte a la toma de decisiones (dss)

sistema de soporte a la toma de decisiones

toma de decisiones -...

sistema de soporte a la toma de decisiones para reducir la

panorama de los sistema de soporte a la toma de...

producción industrial sistemas de soporte para la toma de...

sistema soporte para la toma de decisiones de la cuenca del...

sc5904 data mining y data warehousing - … · para apoyar...