análisis de varianza

40
FACILITADOR: REALIZADO POR: LCDA. ESP. MSC CARLENA ASTUDILLO ING. DANIEL O RDAZ. C.I. 17.008.193 ING. ANGEL SALAZAR. C.I. 17.74 7.156 EL TIGRE, ENERO DE 2015 UNIVERSIDAD NORORIENTAL PRIVADA GRAN MARISCAL DE AYACUCHO DECANATO DE POSTGRADO COORDINACIÓN DE POSTGRADO NÚCLEO EL TIGRE MAESTRÍA DE INGENIERÍA DE MANTENIMIENTO MENCIÓN CONFIABILIDAD INDUSTRIAL CATEDRA: ESTADÍSTICA APLICADA ESTADIO COGNOSCIENTE III

Upload: angel-salazar

Post on 20-Jul-2015

212 views

Category:

Education


0 download

TRANSCRIPT

FACILITADOR: REALIZADO POR:

LCDA. ESP. MSC CARLENA ASTUDILLO ING. DANIEL ORDAZ. C.I. 17.008.193

ING. ANGEL SALAZAR. C.I. 17.747.156

EL TIGRE, ENERO DE 2015

UNIVERSIDAD NORORIENTAL PRIVADA

GRAN MARISCAL DE AYACUCHO

DECANATO DE POSTGRADO

COORDINACIÓN DE POSTGRADO

NÚCLEO EL TIGRE

MAESTRÍA DE INGENIERÍA DE MANTENIMIENTO

MENCIÓN CONFIABILIDAD INDUSTRIAL

CATEDRA: ESTADÍSTICA APLICADA

ESTADIO COGNOSCIENTE III

CONTENIDO

ANÁLISIS DE VARIANZA

Diseño completamente aleatorizados

Diseño con bloques aleatorizados

Comparaciones múltiples

Análisis de Covarianza

ANÁLISIS DE VARIANZA

• En estadística, el análisis de la varianza (ANOVA, ANalysis Of Variance, segúnterminología inglesa) es una colección de modelos estadísticos y sus procedimientosasociados, en el cual la varianza está particionada en ciertos componentes debidosa diferentes factores (variables).

El ANOVA es la herramienta básica para el análisis de los modelos estadísticos deDiseño de Experimentos y Regresión Lineal, porque permite descomponer lavariabilidad de un experimento en componentes independientes que puedenasignarse a diferentes causas.

• La varianza es la media aritmética del cuadrado de las desviaciones respecto a lamedia de una distribución estadística.

• Se deben satisfacer tres supuestos básicos antes de utilizar el análisis de varianza.1) Las muestras deben ser de tipo aleatorio independiente. 2) Las muestras debenser obtenidas a partir de poblaciones normales. 3) Las muestras deben tenervarianzas iguales

1. DISEÑO COMPLETAMENTE ALEATORIZADOS

Este diseño no impone ninguna restricción en cuanto a las unidades experimentales,

estas deberán ser, en todo caso, homogéneas. Además, su estructura no se ve

afectado por el número igual o desigual de observaciones por tratamiento.

1.1. Definición

1. DISEÑO COMPLETAMENTE ALEATORIZADOS

1.2. Modelo Aditivo Lineal

1. DISEÑO COMPLETAMENTE ALEATORIZADOS

1.3. Modelo de efectos aleatorios o modelo de componentes de

varianza.

1. DISEÑO COMPLETAMENTE ALEATORIZADOS

Las pruebas exactas de F se pueden obtener por los cuadrados

medios esperados. Por ejemplo, la prueba exacta de F para el

modelo II con igual número de observaciones es:

A manera de ejemplo se exponen los cuadrados medios

esperados para igual y desigual número de observaciones por

tratamiento.

1. DISEÑO COMPLETAMENTE ALEATORIZADOS

Representación simbólica y esquemática para el Diseño Completamente

Aleatorizado.

Ventajas Desventajas

1. DISEÑO COMPLETAMENTE ALEATORIZADOS

2. DISEÑO CON BLOQUES ALEATORIZADOS

Consiste en formar bloques con las muestras que reciben diferentes

tratamiento. Un bloque es un equipo de individuos similares a la cual se aplica

un tratamiento. Una forma de reducir el efecto de los factores ajenos es diseñar

el experimento que tenga un diseño completamente aleatorio DCA, en el que

cada elemento que tenga la misma posibilidad de pertenecer a las diferentes

categorías o tratamientos.

2.1. Definición

En este orden de ideas,

los pasos que el

investigador sigue son:

2. DISEÑO CON BLOQUES ALEATORIZADOS

El esquema dado a continuación

ayuda a comprender la filosofía

de la formación de bloques:

2. DISEÑO CON BLOQUES ALEATORIZADOS

Debe existir una variación máxima entre losbloques.

Debe existir una variación mínima entre lasunidades experimentales dentro del bloque.

Todos los tratamientos, se le aplican en todoslos bloques.

La formación de los tamaños del los bloquespueden ser iguales o diferentes.

2.2. Características o criterios para bloquear un

experimento

2. DISEÑO CON BLOQUES ALEATORIZADOS

2.3. Modelo aditivo lineal

Representación

esquemática del diseño en

Bloques completos al azar

2. DISEÑO CON BLOQUES ALEATORIZADOS

2.4. Cuadro de Anova

Ventajas Desventajas

2. DISEÑO CON BLOQUES ALEATORIZADOS

3. COMPARACIONES MÚLTIPLES

Al estudiar el comportamiento de los tratamientos de un factor, medianteun análisis de la varianza, el único objetivo es saber si, globalmente,dichos tratamientos difieren significativamente entre sí. Ahora estamosinteresados, una vez aceptada la existencia de diferencias entre losefectos del factor, en conocer qué tratamientos concretos producenmayor efecto o cuáles son los tratamientos diferentes entre sí. En estasmismas condiciones, puede ser útil también realizar comparacionesadicionales entre grupos de medias de los tratamientos.

El ANOVA solamente informa de si hay diferencias entre medias, perono de cuales son estas.

Las comparaciones múltiples se realizan para averiguar que mediasdifieren de cuales otras.

3.1. Definición y características

3. COMPARACIONES MÚLTIPLES

Una vez que el ANOVA ha mostrado que un valor de F es significativo(rechazo de la hipótesis nula), se puede aplicar una prueba como la Dunnett,Duncan, Newman-Keuls, Tuckey o el de la Diferencia Significativa Menor(L.S.D), entre otras que se han propuesto.

Todos los procedimientos involucran el cálculo de un valor que es comparadocon la diferencia entre promedios. Si este valor es más pequeño que lasdiferencias quiere decir que éstas son significativamente diferentes.

Tradicionalmente, las comparaciones múltiples se realizan al mismo nivel designificancia que el ANOVA. Por ejemplo, para un ANOVA significativo a unnivel de 5% (a = 0,05), se realizan comparaciones múltiples al 5%. Sinembargo, algunos investigadores realizan comparaciones a niveles diferenteslo cual, desde el punto de vista estadístico también es posible realizar. Loque no puede hacerse, sin embargo, es realizar comparaciones múltiples alnivel de 1% (a = 0,01) cuando el ANOVA sólo muestra diferencias al 5%.

3. COMPARACIONES MÚLTIPLES

3.3. Tablas y formulas empleadas en los cálculos

Tabla 3.1 Fórmula para calcular tos valores de rango

para las comparaciones múltiples.

3. COMPARACIONES MÚLTIPLES

Tabla 3.2. Tabla de t adaptada para el método da la Diferencia significativa

Mínima (L.S.D.), para comparaciones múltiples, al nivel a = 0,05 y 0,01 (en

negrita)

3. COMPARACIONES MÚLTIPLES

Tabla 3.3. Tabla de Dunnett para comparaciones entre varios

tratamientos con un control, al nivel a = 0,05 y 0,01 (negrita).

3. COMPARACIONES MÚLTIPLES

Tabla 3.4. Tabla de Newman - Keuls y de Tuckey para comparaciones

múltiples, al nivel a = 0,05 y 0,01 (en negrita)

3. COMPARACIONES MÚLTIPLES

Tabla 3.5. Tabla de Duncan para comparaciones múltiples, al nivel =

0,05 y 0,01 (en negrita).

4. ANÁLISIS DE COVARIANZA

Significa variación simultánea de dos variables que se asume están

influyendo sobre la variable respuesta. En este caso se tiene la variable

independiente tratamientos y otra variable que no es efecto de

tratamientos pero que influye en la variable de respuesta, llamada a

menudo: covariable.

El Análisis de Covarianza consiste básicamente en elegir una o más

variables adicionales o covariables que estén relacionadas con la

variable de respuesta, evitando que los promedios de tratamientos se

confundan con los de las covariables, incrementando de esa manera la

precisión del experimento. En este análisis se asume que la variable

dependiente Y está asociada en forma lineal con la variable

independiente X, existiendo homogeneidad de pendientes.

4.1. Covarianza. Definición.

4. ANÁLISIS DE COVARIANZA

4.2. Análisis de Covarianza.

El análisis de covarianza (ANCOVA) combina las ventajas e integra en uno

solo, dos procedimientos:

El análisis de regresión.

El análisis de varianza.

En el ANCOVA se incluyen tres tipos de variables:

1. La(s) variable(s) independiente(s), cuyos efectos se quiere estimar.

2. La(s) variable(s) dependiente(s), que representan los resultados

obtenidos después de aplicar el tratamiento.

3. La(s) variable(s) covariadas, incluidas en el diseño para controlar su

relación con la VD.

5. EJEMPLO PRÁCTICO DE APLICACIÓN

SPSS para Windows. Análisis Estadístico

SPSS Es uno de los programas estadísticos más conocidos teniendo

en cuenta su capacidad para trabajar con grandes bases de datos y un

sencillo interface para la mayoría de los análisis. En la versión 12 de

SPSS se podían realizar análisis con 2 millones de registros y 250.000

variables. El programa consiste en un módulo base y módulos anexos

que se han ido actualizando constantemente con nuevos

procedimientos estadísticos.

5. EJEMPLO PRÁCTICO DE APLICACIÓN

Ejemplo práctico de aplicación.

Determinar las fallas mas comunes presentadas por cuatro tornos,

ubicados en el laboratorio de máquinas y herramientas de la Universidad

Politécnica Territorial José Antonio Anzoátegui.

Información del estudio

•Tornos a estudiar: 4

•Tiempo experimental: 30 días ( 40 horas semanales, 8 horas/día)

•Horas máquinas de estudio: 160 horas

•Fallas a estudiar: 3

•Descripción de las fallas:

•Falla 1: por sellos

•Falla 2: por empacaduras

•Falla 3: por bujes

5. EJEMPLO PRÁCTICO DE APLICACIÓN

5. EJEMPLO PRÁCTICO DE APLICACIÓN

5. EJEMPLO PRÁCTICO DE APLICACIÓN

5. EJEMPLO PRÁCTICO DE APLICACIÓN

5. EJEMPLO PRÁCTICO DE APLICACIÓN

Estadísticos

TORNOS FALLAS

HORAS

MÁQUINAS

N Válidos 12 12 12

Perdidos 8 8 8

Varianza 1,364 ,727 843,000

TORNOS

Frecuencia Porcentaje

Porcentaje

válido

Porcentaje

acumulado

Válidos 1 3 15,0 25,0 25,0

2 3 15,0 25,0 50,0

3 3 15,0 25,0 75,0

4 3 15,0 25,0 100,0

Total 12 60,0 100,0

Perdidos Sistema 8 40,0

Total 20 100,0

Resultados obtenidos

1. Análisis de

Varianza

5. EJEMPLO PRÁCTICO DE APLICACIÓN

HORAS MÁQUINAS

Frecuencia Porcentaje

Porcentaje

válido

Porcentaje

acumulado

Válidos 84 (S) 1 5,0 8,3 8,3

100 (B-S) 2 10,0 16,7 25,0

120 (E-B) 2 10,0 16,7 41,7

130 (B) 1 5,0 8,3 50,0

160 (No fallo) 6 30,0 50,0 100,0

Total 12 60,0 100,0

Perdidos Sistema 8 40,0

Total 20 100,0

FALLAS

Frecuencia Porcentaje

Porcentaje

válido

Porcentaje

acumulado

Válidos SELLOS 4 20,0 33,3 33,3

EMPACADURA

S

4 20,0 33,3 66,7

BUJES 4 20,0 33,3 100,0

Total 12 60,0 100,0

Perdidos Sistema 8 40,0

Total 20 100,0

5. EJEMPLO PRÁCTICO DE APLICACIÓN

2. Diseño completamente

aleatorizadosFactores inter-sujetos

N

TORNOS 1 3

2 3

3 3

4 3

HORAS MÁQUINAS 84 1

100 2

120 2

130 1

160 6

Pruebas de los efectos inter-sujetos

Variable dependiente:FALLAS

Origen

Suma de

cuadrados tipo

III gl

Media

cuadrática F Sig.

Modelo corregido 7,000a 9 ,778 1,556 ,452

Intersección 40,371 1 40,371 80,742 ,012

TORNOS 2,582 3 ,861 1,721 ,388

HMAQUINAS 4,962 4 1,241 2,481 ,307

TORNOS * HMAQUINAS 1,923 2 ,962 1,923 ,342

Error 1,000 2 ,500

Total 56,000 12

Total corregida 8,000 11

5. EJEMPLO PRÁCTICO DE APLICACIÓN

Factores inter-sujetos

N

TORNOS 1 3

2 3

3 3

4 3

HORAS MÁQUINAS 84 1

100 2

120 2

130 1

160 6

Contraste de Levene sobre la igualdad de las

varianzas errora

Variable dependiente:FALLAS

F gl1 gl2 Sig.

. 9 2 .

Pruebas de los efectos inter-sujetos

Variable dependiente:FALLAS

Origen

Suma de

cuadrados tipo

III gl

Media

cuadrática F Sig.

Modelo corregido 7,000a 9 ,778 1,556 ,452

Intersección 40,371 1 40,371 80,742 ,012

TORNOS 2,582 3 ,861 1,721 ,388

HMAQUINAS 4,962 4 1,241 2,481 ,307

TORNOS * HMAQUINAS 1,923 2 ,962 1,923 ,342

Error 1,000 2 ,500

Total 56,000 12

Total corregida 8,000 11

2. Diseño completamente

aleatorizados

5. EJEMPLO PRÁCTICO DE APLICACIÓN

TORNOS

Variable dependiente:FALLAS

TORNOS Media Error típ.

Intervalo de confianza 95%

Límite inferior Límite superior

1 1,750a ,433 -,113 3,613

2 2,250a ,433 ,387 4,113

3 2,000a ,408 ,243 3,757

4 2,000a ,408 ,243 3,757

Medias marginales estimadas

Pruebas de los efectos inter-sujetos

Variable dependiente:FALLAS

Origen

Suma de

cuadrados tipo

III gl

Media

cuadrática F Sig.

Modelo corregido 7,000a 9 ,778 1,556 ,452

Intersección 40,371 1 40,371 80,742 ,012

TORNOS 2,582 3 ,861 1,721 ,388

HMAQUINAS 4,962 4 1,241 2,481 ,307

TORNOS * HMAQUINAS 1,923 2 ,962 1,923 ,342

Error 1,000 2 ,500

Total 56,000 12

Total corregida 8,000 11

Factores inter-sujetos

N

TORNOS 1 3

2 3

3 3

4 3

HORAS MÁQUINAS 84 1

100 2

120 2

130 1

160 6

2. Diseño completamente

aleatorizados

5. EJEMPLO PRÁCTICO DE APLICACIÓN

3. Diseño con bloques aleatorizados

Factores inter-sujetos

N

TORNOS 1 3

2 3

3 3

4 3

HORAS MÁQUINAS 84 1

100 2

120 2

130 1

160 6

Pruebas de los efectos inter-sujetos

Variable dependiente:FALLAS

Origen

Suma de

cuadrados tipo

III gl

Media

cuadrática F Sig.

Modelo corregido 5,077a 7 ,725 ,992 ,536

Intersección 34,068 1 34,068 46,620 ,002

TORNOS 2,410 3 ,803 1,099 ,446

HMAQUINAS 5,077 4 1,269 1,737 ,303

Error 2,923 4 ,731

Total 56,000 12

Total corregida 8,000 11

5. EJEMPLO PRÁCTICO DE APLICACIÓN

4. Comparaciones múltiples

Comparaciones múltiples

Variable dependiente:FALLAS

(I)TORNOS (J)TORNOS

Diferencia de

medias (I-J) Error típ. Sig.

DHS de Tukey 1 2 ,00 ,577 1,000

3 ,00 ,577 1,000

4 ,00 ,577 1,000

2 1 ,00 ,577 1,000

3 ,00 ,577 1,000

4 ,00 ,577 1,000

3 1 ,00 ,577 1,000

2 ,00 ,577 1,000

4 ,00 ,577 1,000

4 1 ,00 ,577 1,000

2 ,00 ,577 1,000

3 ,00 ,577 1,000

Bonferroni 1 2 ,00 ,577 1,000

3 ,00 ,577 1,000

4 ,00 ,577 1,000

2 1 ,00 ,577 1,000

3 ,00 ,577 1,000

4 ,00 ,577 1,000

3 1 ,00 ,577 1,000

2 ,00 ,577 1,000

4 ,00 ,577 1,000

4 1 ,00 ,577 1,000

2 ,00 ,577 1,000

3 ,00 ,577 1,000

5. EJEMPLO PRÁCTICO DE APLICACIÓN

4. Comparaciones múltiples

FALLAS

TORNOS N

Subconjunto

1

Student-Newman-Keulsa,b 1 3 2,00

2 3 2,00

3 3 2,00

4 3 2,00

Sig. 1,000

DHS de Tukeya,b 1 3 2,00

2 3 2,00

3 3 2,00

4 3 2,00

Sig. 1,000

5. EJEMPLO PRÁCTICO DE APLICACIÓN

Correlaciones

TORNOS FALLAS

HORAS

MÁQUINAS

TORNOS Correlación de Pearson 1 ,000 -,110

Sig. (bilateral) 1,000 ,734

Suma de cuadrados y

productos cruzados

15,000 ,000 -41,000

Covarianza 1,364 ,000 -3,727

N 12 12 12

FALLAS Correlación de Pearson ,000 1 ,022

Sig. (bilateral) 1,000 ,946

Suma de cuadrados y

productos cruzados

,000 8,000 6,000

Covarianza ,000 ,727 ,545

N 12 12 12

HORAS MÁQUINAS Correlación de Pearson -,110 ,022 1

Sig. (bilateral) ,734 ,946

Suma de cuadrados y

productos cruzados

-41,000 6,000 9273,000

Covarianza -3,727 ,545 843,000

N 12 12 12

5. Covarianzas

GRACIAS POR SU ATENCIÓN