temas basicos de estadistica diferencial.doc

159

Click here to load reader

Upload: ivonne-arcos-guerrero

Post on 13-Jul-2016

270 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________

1. ANÁLISIS DE REGRESIÓN LINEAL

1.1 Introducción.

La relación lineal es el tipo de correlación más sencillo que se encuentra entre dos variables, una llamada variable independiente y otra llamada variable dependiente, debido a que esta última depende de los cambios que sufra la primera.

El objetivo de estudiar la correlación entre dos variables es con la esperanza de que la relación que se encuentre entre ellas pueda utilizarse como auxiliar en la realización de predicciones con cierta precisión establecida. Lo antes expuesto puede lograrse al ajustar una ecuación de primer grado de la forma , a un conjunto de pares de valores de datos observados.

El tema contempla el estudio de los conceptos de correlación y regresión, obtención del diagrama de dispersión de los datos, cálculo del coeficiente de correlación y regresión, obtención de la ecuación que mejor se ajusta a los valores observados, cálculo del error estándar de estimación, análisis de varianza para probar la significación de la regresión, estimación de intervalos de confianza en la regresión lineal, validación del modelo mediante el análisis residual y empleo del software minitab.

1.2 Correlación lineal y regresión.

Los términos correlación y regresión pueden parecer complicados, sin embargo las ideas básicas implicadas en los mismos es tan sencilla que en gran parte del tiempo las estamos utilizando, para comprender mejor estos términos veamos los siguientes ejemplos.

Si se aplica cierto fertilizante en algún cultivo, comúnmente notamos que se obtiene un incremento en la producción a medida que se aumenta el nutriente hasta cierto punto, más allá de este punto la producción se estabiliza o disminuye si se utilizan cantidades excesivas de abono.

Este ejemplo implica dos variables, la magnitud de una dependiendo de la otra. Estas variables se denominan independiente (fertilizante) y dependiente (producción), presenta la idea de que cuando una variable se incrementa así lo hará la otra o viceversa, en estadística esto recibe el nombre de correlación directa o positiva.

Veamos otro ejemplo. Un instructor esta interesado en encontrar como está relacionada la ausencia de estudiantes en un día determinado, con la temperatura mínima en 0C a las 8 de la mañana de ese día, durante un periodo de invierno. Una muestra aleatoria de 10 días se utilizo para el estudio proporcionando los siguientes valores.

1

Page 2: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________

y 10 4 1 9 8 6 2 3 5 6x 10 20 25 12 13 15 23 21 18 17

Aquí una variable depende de la otra, pero hay un pequeño giro en las relaciones entre las mismas. El incremento de una variable se acompaña por la disminución de la otra o viceversa, esto se denomina correlación inversa o negativa.

Otros ejemplos de correlación son los problemas que encontramos diariamente en el trabajo, tales como:

¿Cuál es la relación entre la temperatura del horno y la resistencia del material?¿Qué relación existe entre el alimento consumido y el peso del ganado?¿Cuál es el precio de una mercancía afectada por la oferta?¿Cuál es la relación entre el tamaño de la granja y su rentabilidad?¿Cuál es la relación entre las horas dedicadas para estudiar una unidad de la materia de estadística y la calificación obtenida?

Otros ejemplos de correlación los encontramos casi a diario en los periódicos en la sección de finanzas, con las gráficas; prácticamente todo gráfico es, en esencia, una representación entre la correlación de dos variables. Donde el eje de la abscisa (x) tiene a la variable independiente y el eje de la ordenada (y), la variable dependiente.

Terminaremos esta hoja definiendo los términos de correlación y regresión de la siguiente manera.

¿Qué es correlación? es la relación que existe entre dos variables y a la estrechez de dicha relación.

¿Qué es regresión? es la cantidad de cambio de una variable asociada a un cambio único de otra variable.

1.3 Cálculo del coeficiente de correlación.

Hasta ahora hemos visto como están relacionadas dos variables, pero aquí surge una pregunta. ¿Qué tan estrechamente relacionadas se encuentran las variables?

Para contestar esta pregunta, necesitamos una medida que cuantifique la estrechez de la relación entre dos variables. Esta medida recibe el nombre de coeficiente de correlación que se representa por la letra r.

Para medir de un modo matemático y más preciso el grado de correlación existente, es necesario determinar un valor numérico que lo exprese y éste es el coeficiente de correlación lineal o r de Pearson. Veamos algunos ejemplos gráficos y su cuantificación matemática en las siguientes gráficas.

2

Page 3: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________

Los valores que puede tomar el coeficiente de correlación lineal van de: -1 ≤ r ≤ 1, cuando el valor de r = 1 ó r = -1 ambos indican correlaciones perfectas, cuando r = 0 significa ausencia de correlación lineal.

Una relación positiva significa: a mayor rendimiento en x mayor rendimiento en y o viceversa. Una correlación negativa significa: a un rendimiento menor en x se tiene un rendimiento mayor en y o viceversa a un rendimiento mayor en x se tiene un rendimiento menor en y.

El algoritmo matemático que simboliza al coeficiente de correlación lineal se define por:

Aplicando álgebra elemental podemos redefinir este algoritmo para facilitar su cálculo como:

3

Page 4: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________

Con el fin de ver su aplicación tomemos el siguiente ejemplo. Un ingeniero esta estudiando el efecto de la temperatura del horno con la resistencia en libras por pulgada cuadrada (psi) de cierta varilla de acero. El estudio da como resultado los siguientes datos.

Temperatura0C (x)

100 110 120 130 140 150 160 170 180 190

Resistencia en psi. (y) 45 51 54 61 66 70 74 78 85 89

Lo primero que debe hacerse es graficar estas variables con el fin de tener una primera idea de como están distribuidos los datos, esto es.

DIAGRAMA DE DISPERSIÓN DE LOS DATOS.

A primera vista la gráfica sugiere que existe correlación lineal entre las dos variables, y que podemos ajustar una ecuación de primer grado de la forma a los valores observados. Los cálculos básicos de la variable dependiente e independiente para el cálculo del coeficiente de correlación r se presentan a continuación.

4

Page 5: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________

n = 10

Substituyendo estos valores en el coeficiente de correlación lineal tenemos:

El valor de r = 0.998 nos indica que existe alta correlación lineal entre la temperatura del horno y la resistencia de la varilla, un valor de uno hubiera sido correlación perfecta. Además de lo anterior el coeficiente r nos dice que la ecuación que ajustemos a los datos tiene una pendiente positiva.

Advertencia

El no encontrar evidencia de correlación lineal entre las variables, se puede deber a:

a) De hecho las dos variables no están relacionadas.

b) Las variables están relacionadas en forma no lineal, en este caso la r de Pearson no nos sirve para medir la relación entre dos variables. Por eso es recomendable que antes de realizar cualquier cálculo se grafiquen los datos, sin olvidarse de emplear la regla de los tres cuartos de altura (el eje de la ordenada y debe medir tres cuartas partes de lo que mida el eje de la abcisa x).

1.4 Regresión lineal.

El hecho de estudiar la correlación entre dos variables, es con la esperanza de que cualquier relación que se encuentre, pueda usarse como auxiliar para hacer estimaciones o predicciones de una variable en particular.

El problema de la predicción lineal se reduce a ajustar una línea recta a un grupo de puntos, ahora bien la ecuación general de la línea recta puede describirse como:

a se denomina “intersección y” porque su valor es el punto en el cual la línea de regresión cruza al eje y.

b es la pendiente de la línea. Representa la cantidad de cambio que sufre la variable y por cada cambio único de la variable x. Visto gráficamente es:

5

Page 6: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________

Para encontrar la pendiente podemos empezar eligiendo dos puntos sobre la línea en la gráfica anterior, así tendremos que (x1, y1) = (1, 5) y (x2, y2) = (2, 7). Entonces, en este punto, podemos calcular el valor b usando esta ecuación:

De esta manera estimamos los valores de los parámetros a y b. Si la ecuación general de la línea recta es , por lo tanto la ecuación que mejor se ajusta a los datos que estamos analizando es.

Con esta ecuación podemos hacer predicciones, suponga que deseamos encontrar el valor de y cuando x = 3. La respuesta será:

Si se sustituyen más valores de x en la ecuación, se observa que y se incrementa en la medida que x aumenta, por lo tanto la relación entre las variables es directa, y la pendiente positiva.

Se recomienda tener mucho cuidado al hacer predicciones, ya que estas son válidas siempre y cuando se hagan dentro del rango de valores que se este estudiando, si se quiere hacer pronósticos fuera del rango observado, es recomendable aumentar los valores observados y estimar una nueva ecuación.

1.5 El método de mínimos cuadrados.

Si tenemos un conjunto de puntos en un diagrama de dispersión, ¿cómo podemos “ajustar” una línea matemáticamente si ninguno de los puntos cae en ella?

6

a = 3

2° Pto. (x2 , y2) = (2,7)

1° Pto. (x1 , y1) = (1,5)

Page 7: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________

En estadística se dice, que una línea tendrá “buen ajuste” si minimiza el error entre los puntos estimados de la línea y los verdaderos puntos observados que se utilizaron para trazarla.

Si tenemos un conjunto de puntos de datos a través de los cuales podríamos trazar un número infinito de líneas de estimación, ¿cómo podemos saber cuándo hemos encontrado la mejor línea de ajuste?

Para lograr lo anterior se emplea el criterio de mínimos cuadrados, que consiste en hacer mínima la suma de cuadrados de los errores de estimación, donde el error de estimación es la diferencia entre el valor observado de la muestra y el valor estimado por la ecuación obtenida.

En estadística existen dos ecuaciones que nos sirven para calcular la pendiente y la intersección y, de la línea de regresión de mejor ajuste y son:

Con estos coeficientes podemos obtener la línea de regresión de mejor ajuste para cualquier conjunto de dos variables de puntos de datos.

1.6 Uso del método de mínimos cuadrados en un problema.

Consideremos el ejemplo de la temperatura del horno y la resistencia de la varilla, los cálculos básicos para el cálculo de los coeficientes de regresión a y b son:

Sustituyendo estos valores en las ecuaciones correspondientes son:

7

Page 8: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________

a = 67.30 – 0.4830 (145.00)= -2.7394

Ahora bien, la ecuación lineal que mejor describe la relación entre la temperatura del horno en grados centígrados y la resistencia de la varilla, la obtenemos al sustituir el valor de a y b en la ecuación de la recta , la cual es:

a = -2.74 nos indica que la ecuación que estimamos corta al eje de la ordenada (y) en un sistema de coordenadas cartesianas en el punto negativo de -2.74.

b = 0.483 significa que por cada grado centígrado de temperatura que aumentemos en el horno, se logra un incremento de 0.483 psi de resistencia en la varilla.

Con esta ecuación podemos predecir el valor de la variable dependiente para algún valor no conocido de x, por ejemplo. ¿Cuánto será la resistencia de la varilla cuando la temperatura del horno sea de 165 oC?

psi.

1.7 Error estándar de estimación.

Después de haber ajustado la línea de regresión a una lista de puntos, generalmente es posible inspeccionar su gráfica y observar que tan exactamente predice los valores de y. Un procedimiento matemático para medir la confiabilidad de la ecuación estimada es el error estándar de estimación, el cual se simboliza por Se y es similar a la desviación estándar, en cuanto a que ambas son medidas de dispersión.

El error estándar de estimación mide la variabilidad, o dispersión de los valores observados alrededor de la línea de regresión. Su cálculo matemático se obtiene por:

Donde: y = valores de la variable dependiente

= valores estimados con la ecuación de regresión 2 = número de parámetros estimados en el modelo (a y b).

Continuando con nuestro ejemplo tenemos:

x 100 110 120 130 140 150 160 170 180 190y 45 51 54 61 66 70 74 78 85 89ŷ 45.6 50.4 55.2 60.1 64.9 69.7 74.6 79.4 84.2 89.0

y – ŷ -0.6 0.6 -1.2 0.9 1.1 0.3 -0.6 -1.4 0.8 0.0(y - ŷ)2 0.36 0.36 1.44 0.81 1.21 0.09 0.36 1.96 0.64 0.0

8

Page 9: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________

Por lo tanto el error estándar de estimación será:

Para saber si el error estándar es chico o grande, se recomienda recurrir al coeficiente de determinación (r2). En el ejemplo que nos ocupa su estimación es de r2 = 99.6 % (calculado en el punto 1.8), lo que nos indica que el error estándar de estimación es de 0.4%, lo cual nos dice que Se es muy pequeño.

El error de estimación obtenido (0.9506) puede compararse con el de otras ecuaciones de mayor grado obtenidas con los mismos datos, aquel valor que sea menor, nos indica que esa ecuación es la que mejor se ajusta al conjunto de puntos.

Entre más pequeño sea el error de estimación, significa un mejor ajuste de la ecuación estimada con relación a los datos observados. Un valor de Se = 0 implica un r = 1 y un r2 = 1, lo que nos indicará un ajuste perfecto, o lo que es lo mismo, los datos observados son exactamente los mismos que los datos estimados.

Otra manera de obtener se presenta a continuación, esto puede servir para verificar si el cálculo del coeficiente de correlación lineal fue bien calculado, así como la ecuación estimada.

Valor muy parecido al obtenido en la tabla anterior.

1.8 Coeficiente de determinación.

El coeficiente de determinación nos sirve para medir que tan bien ajusta la línea de regresión estimada a los datos con los que está basada, ya que éste lo podemos manejar en porcentaje, pudiendo tomar valores que van del 0 al 100%. Así si el coeficiente está cercano a cero significa que Se es chico. Su algoritmo se define por:

En el ejemplo que nos ocupa su cálculo es:

9

Page 10: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________Lo que significa que el 99.6% de la variación total de la resistencia de la varilla (y), se puede explicar por la asociación del efecto de la temperatura del horno (x). Dicho en otras palabras, la recta que calculamos nos logra explicar el 99.6% de la variabilidad de la resistencia de la varilla, o sea que el error estándar de estimación en porcentaje es de 100 - 99.6 = 0.4%, lo cual indica que es un error muy pequeño.

1.9 Prueba de hipótesis de la regresión lineal simple.

Una parte importante en la elaboración de un modelo de regresión simple, es la prueba de hipótesis estadística en torno a los parámetros del modelo y la construcción de ciertos intervalos de confianza.

Para probar hipótesis de la pendiente (b) y la intersección y (a) suponemos que los errores de estimación se distribuyen normalmente.

Si deseamos probar la hipótesis de que la pendiente es igual a una constante, digamos , las hipótesis a probar son:

H0: b = H1: b

El estadístico de prueba para éste tipo de casos es:

Donde CME es el cuadrado medio del error del análisis de varianza de la regresión, y tc es la distribución t de Student con v = n - 2 grados de libertad, donde n es el número de pares de datos. Se rechazara H0 si:

Un Procedimiento similar es utilizado para probar la hipótesis respecto a la intersección (a).

Para probar. H0: a = 1

H1: a 1

Utilizamos el estadístico:

10

Page 11: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________

Se rechaza la hipótesis H0 si:

Un caso muy especial en la prueba de hipótesis es:

H0: b = 0H1: b 0

Esta hipótesis se relaciona con la significación de la regresión. El hecho de aceptar la hipótesis H0, equivale a concluir que no hay regresión lineal entre x y y. Visto esto gráficamente es:

En las gráficas anteriores se acepta la hipótesis H0, por lo tanto se concluye que no hay correlación lineal entre x y y.

11

Page 12: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________En estas gráficas se rechaza la hipótesis H0, lo que significa que existe correlación lineal entre x y y.

1.10 Análisis de varianza para probar la significación de la regresión.

El procedimiento para saber si la variable independiente influye de manera significativa en la variable dependiente (significación de la regresión), consiste en la partición de la variabilidad total de la variable dependiente (y) en dos componentes, una debido a la regresión y otra debido al azar.

El análisis de varianza (ANOVA) como su nombre lo indica va a probar mediante la comparación de las varianzas si existe efecto de la regresión entre las dos variables. Las fuentes de variación que componen el ANOVA son:

Fuente de variación

Suma de cuadrados Grados de

libertad

Cuadrado medio F

Regresión

1

Error n – 2

Total n - 1

Si la probabilidad de tener una F igual a la obtenida en el ANOVA es menor al 5% se rechaza la hipótesis H0: b = 0 y se acepta la hipótesis H1: b ≠ 0, con lo que se concluye que la variable independiente influye de manera significativa en la variable dependiente.

Continuando con el ejemplo del efecto de la temperatura del horno y la resistencia de la varilla, los cálculos básicos para la obtención de las sumas de cuadrados son:

b = 0.483

Por lo tanto las sumas de cuadrados son:

12

Page 13: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________Suma de cuadrados total = 47,225 – (673)2 10 = 1,932.1Suma de cuadrados de la Reg. = 0.483 101,570 - 1,450 673 10 = 1,924.75Suma de cuadrados del error = 1,932.1 – 1,924.75 = 7.35

La tabla del análisis de varianza queda definida de la siguiente manera:

ANOVA DE LA TEMPERATURA DEL HORNO Y LA RESISTENCIA DE LA VARILLA.

Fuente de variación

Suma de cuadrados

Grados de libertad

Cuadrado medio

F

Regresión 1,924.75 1 1,924.75 2,094.4Error 7.35 8 0.919Total 1,932.10 9

Para decidir si la temperatura del horno influye de manera significativa en la resistencia de la varilla, se obtiene la probabilidad de tener una F = 2,094.4 de la tabla F de Fisher. Si la probabilidad de tener una F igual a la de la muestra es menor al 5% se rechaza la hipótesis H0.

La manera como se busca la probabilidad en la tabla F de Fisher es: localizar en la parte superior de la tabla los grados de libertad para el numerador de la razón F que se tienen en el ANOVA, en nuestro caso v1 = 1; posteriormente se busca en la parte izquierda de la tabla los grados de libertad del denominador, en nuestro ejemplo v2 = 8. Donde se intercepten v1 y v2 se localiza el valor de F esperada en el análisis a cierto nivele de . En nuestro caso son:

v1 = 1v2 = 0.10 = 0.05 = 0.018 3.46 5.32 11.26

Aquí se puede ver que el valor de F = 2,094.4 se encuentra a la derecha de 11.26 por lo que le corresponde una probabilidad menor a 0.01. Puesto que la probabilidad de que se hubiese obtenido por mero azar una F = 2,094.4 es menor al 5%, rechazamos la hipótesis nula H0: b = 0 y aceptamos la hipótesis alterna H1 b 0, con lo que se puede concluir que la temperatura del horno si influye de manera significativa en la resistencia de la varilla.

En la práctica una manera de concluir lo anterior en este ejemplo es mediante la comparación de la F del análisis contra una . Si la F calculada es mayor que la F de tablas, se concluye que la variable independiente si influye de manera significativa en la variable dependiente.

De este análisis podemos ver que la recta que calculamos nos explica el 99.6% de la variabilidad de y, esto es (1,924.75 1,932.1) 100 = 99.6, valor idéntico al del coeficiente de determinación.

13

Page 14: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________También puede apreciarse que la suma de cuadrados del error 7.35, es muy parecido a (y - ŷ)2 obtenida en el punto 1.7, lo cual puede servir para verificar nuestros cálculos

1.11 Estimación de intervalos en la regresión lineal simple.

Además de la estimación de los parámetros a y b de la ecuación estimada es posible obtener estimaciones de intervalos de confianza para estos parámetros, el ancho de estos intervalos es una media de la calidad total de la línea de regresión.

En consecuencia el intervalo de confianza 100 (1 - α) % para la pendiente b, está dado por el siguiente intervalo, donde t es un valor de t de Student con un cierto nivel con v = n - 2 grados de libertad y CME es el cuadrado medio del error del ANOVA.

Continuando con nuestro ejemplo un intervalo de confianza al 95% de probabilidad para la pendiente b es:

P (0.483 - 0.024338 b 0.483 + 0.024338) = 0.95P (0.46 b 0.51) = 0.95

Este resultado debe leerse de la siguiente manera: la probabilidad de que el intervalo contenga el valor verdadero de b es del 95%, así mismo nos dice que la pendiente puede tomar valores que van de 0.46 a 0.51

El intervalo nos indica que se tiene una confianza del 95% de que la pendiente estimada de la ecuación, diferirá de la pendiente verdadera de la población, en una cantidad que no excede a 0.024338. O lo que es lo mismo se tiene un error de estimación del 5% (0.024338 x 100 / 0.483).

En forma semejante el intervalo de confianza del 100 (1 - α) % para la intersección y (a) es.

14

Page 15: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________

Por lo tanto un intervalo de confianza al 95% para a se define por:

P (-6.34 ≤ a ≤ 0.86) = 0.95

Lo anterior nos indica que con un 95% de probabilidad, que el valor de la intersección y (a) puede tomar valores que van desde -6.34 a 0.86

1.12 Medida de adecuación del modelo de regresión.

El ajuste de un modelo de regresión requiere de varios supuestos. Así para la estimación de parámetros se supone que los errores de estimación (e i) son variables aleatorias con media cero y varianza constante. Para la prueba de hipótesis y la estimación de intervalos se supone que los errores se distribuyen normalmente, además se supone que el grado al que se ajustó la ecuación (modelo) es el correcto.

1.12.1. Análisis residual.

Para juzgar si el modelo que se ajustó a los valores observados es correcto se lleva a cabo el análisis residual, lo cual nos sirve para saber si se cumplen los siguientes supuestos que debe cumplir el modelo, los cuales son:

1. En las pruebas de hipótesis y la estimación de intervalos, requiere que los errores de estimación se ajusten a una distribución normal.2. Los errores de estimación son variables aleatorias no correlacionadas, que tienen media igual a cero y varianza constante.3. El orden del modelo es correcto.

Para verificar los supuestos anteriores, se recomienda recurrir al análisis residual por su fácil interpretación, donde un residuo se define como , i = 1, 2, 3,…, n, donde yi es la variable dependiente y ŷi es el valor estimado con la ecuación obtenida.

15

Page 16: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________Estos residuos suelen graficarse generalmente contra: 1) la secuencia del tiempo (si se conoce), 2) contra ŷi y 3) contra la variable independiente xi. Estas gráficas por lo general se presentan como lo indican los cuatro patrones siguientes:

A) Satisfactorio B) Embudo

C) Doble arco D) No lineal

La figura A representa la situación ideal, mientras que las B, C y D representan anomalías. Si los residuos aparecen como en B entonces nos indica que la varianza de las observaciones se incrementa con el tiempo o con la magnitud de yi o xi , lo cual no debe suceder. Para resolver este problema si se presenta, se recomienda transformar la variable de respuesta y a: , ln y o 1/y. Si las gráficas contra ŷi y xi se presentan como la figura C nos indica desigualdad de varianzas. Las gráficas de residuos que se observan como D nos indican que el modelo no es adecuado, lo que significa que debe adaptarse a un modelo de mayor orden (cuadrática, cúbica, etc). En el ejemplo que nos ocupa, los valores estimados ( ) y los residuos ( ) se presentan en la tabla siguiente.

x 100 110 120 130 140 150 160 170 180 190y 45 51 54 61 66 70 74 78 85 89ŷ 45.6 50.4 55.2 60.1 64.9 69.7 74.6 79.4 84.2 89.0

16

ei 0 ei 0

ei 0 ei 0

Page 17: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________

e1

-0.6e2

0.6e3

-1.2e4

0.9e5

1.1e6

0.3e7

-0.6e8

-1.4e9

0.8e10

0.0

La gráfica de residuos residuos contra los datos estimados y contra la variable independiente , se presentan a continuación.

GRÁFICA DE RESIDUOS CONTRA

GRÁFICA DE RESIDUOS CONTRA xi

En ambas gráficas se puede apreciar que no hay un patrón definido en su figura, lo que significa que las varianzas no se incrementan o disminuyen con el aumento de

o de , lo que nos indica que las varianzas de los errores son iguales.

17

Page 18: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________A la vez podemos observar que los residuos son aleatorios y su promedio es cero (hay igual número de errores positivos como negativos).

Para verificar el supuesto de que los errores se distribuyen de manera normal realizamos la gráfica normal de residuos, en ella se puede observar que los residuos caen aproximadamente sobre una recta, con lo que se puede concluir que no hay desviación importante de normalidad, o sea que el supuesto de que los errores se distribuyen de manera normal se cumple.

Cuando aparecen valores atípicos, es decir observaciones que no son típicas al resto de los datos, significa que los errores no se distribuyen de manera normal. Si desea más información sobre puntos atípicos consulte a Montgomery y Peck.

Por lo tanto en base a la evidencia encontrada en las gráficas, podemos concluir que no existe insuficiencia seria del modelo, dicho en otras palabras nuestro modelo es válido.

Cuando aparece un patrón en las gráficas, por lo general suele indicar la necesidad de una transformación de los datos originales, esto es, analizar los datos en una métrica diferente. Por ejemplo, si la variabilidad de los residuos aumenta con ŷi o xi

entonces es conveniente aplicar la transformación logarítmica. Si los datos analizados se encuentran en porcentaje, es recomendable la transformación arcoseno. Si se analizan valores pequeños con decimales, lo recomendable es la transformación raíz cuadrada y si la variable es el cociente de dos variables, la transformación logarítmica es la adecuada.

Una vez hecha la trasformación de los datos originales se lleva a cabo el análisis de regresión como si se tratara de datos normales.

18

Page 19: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________Con los datos obtenidos hasta aquí, podemos ya responder a algunas preguntas como:

1. ¿Cuán estrecha es la relación entre la temperatura del horno y la resistencia de la varilla?

R. Totalmente estrecha. El coeficiente de correlación es de 0.998, el 1 sería el perfecto.

2. ¿Cuál es la probabilidad de que tal correlación pudiera deberse a la casualidad?

R. Una correlación de este tamaño de 10 pares de datos, solo podría ocurrir por casualidad menos del 1% de las veces.

3. ¿Qué ecuación describe mejor la relación entre la temperatura del horno y la resistencia de la varilla?

R.

4. ¿Hasta qué punto se ajusta esta recta a los datos?

R. El 99.6% de la variación de la resistencia de la varilla (y) estuvo asociada de algún modo con la temperatura del horno (x).

5. ¿Influye significativamente la temperatura del horno en la resistencia de la varilla?

R. El análisis de varianza de la regresión indica que sí, con un 99 % de probabilidad.

6. ¿El modelo que fue ajustado a los valores observados es el correcto?

R. En base al análisis residual, podemos concluir que no existe insuficiencia seria del modelo.

Apéndice 1.1 Empleo del software Minitab en el análisis de regresión lineal.

Análisis de regresión lineal.

19

Page 20: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________Para ilustrar el empleo del software Minitab en la elaboración del análisis de regresión lineal, tomaremos el ejemplo de la temperatura del horno y la resistencia en psi. de cierta varilla de acero. Los pasos a seguir pueden ser:

1. En la columna C1 de la hoja de cálculo, rotule “x” (predictora) y en C2 “y” (respuesta). 2. La manera como es concentrada la variable predictora y la variable respuesta, puede ser.

C1 C2x y

1 100 452 110 513 120 544 130 615 140 666 150 707 160 748 170 789 180 8510 190 89

3. Seleccione el menú Estadísticas.

4. Seleccione el menú Regresión.

5. Hacer clic en Regresión.

6. Cuando aparezca el cuadro de diálogo Regresión. Ingresar C2 en el cuadro de Respuestas. Ingresar C1 en el cuadro Predictores. Hacer clic en el cuadro de Gráficas.

7. Cuando aparezca el cuadro de diálogo Regresión-Gráficas. Hacer clic en el botón Gráficas individuales. Hacer clic en el cuadro Gráfica normal de residuos. Hacer clic en el cuadro Residuos vs. Ajustes. Hacer clic en el cuadro Residuos vs las variables. Ingresar C1 en el cuadro Residuos vs las variables. Hacer clic en Aceptar. Hacer clic en el cuadro de Resultados.

8. Cuando aparezca el cuadro de diálogo Regresión-Resultados. Hacer clic en Ecuación de regresión, tabla de coeficientes, s, R-cuadrado y análisis básico de varianza. Hacer clic en Aceptar. Hacer clic en el cuadro de Almacenamiento.

20

Page 21: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Análisis de regresión lineal___________________________________________________________________________________________

9. Cuando aparezca el cuadro de diálogo Regresión-Almacenamiento. Hacer clic en los cuadros que le interesen. Hacer clic en Aceptar. Hacer clic en Aceptar.

En los cuadros de diálogo, Minitab tiene otras posibilidades más que usted puede aprovechar seleccionando las opciones que desee.

Elaboración de un diagrama de dispersión.

Para mostrar el empleo de Minitab en la elaboración de un diagrama de dispersión, tomaremos los diez pares de datos concentrados en las columnas de C1 y C2 del tema anterior sobre Análisis de regresión lineal.

1. Seleccione el menú Gráfica.

2. Hacer clic en gráfica de dispersión.

3. Cuando aparezca el cuadro de diálogo Gráficas de dispersión. Hacer clic en el cuadro Simple. Hacer clic en Aceptar.

4. Cuando aparezca el cuadro de diálogo Gráficas de dispersión-simple. Ingresar C2 en el cuadro de Variables y. Ingresar C1 en el cuadro Variables x. Hacer clic en Etiquetas.

5. Cuando aparezca el cuadro de diálogo Gráfica de dispersión-etiquetas. Ingresar Temperatura del horno y resistencia de la varilla en el cuadro de Título. Ingresar x = temperatura del horno en el cuadro Nota al pie de página 1: Ingresar y = resistencia de la varilla en psi. en el cuadro Nota al pie de página 2: Hacer clic en Aceptar. Hacer clic en Mostrar datos.

6. Cuando aparezca el cuadro de diálogo Gráfica de dispersión-Vista de datos. Hacer clic en el cuadro de Símbolos. Hacer clic en Aceptar. Hacer clic en Aceptar.

21

Page 22: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________

2. REGRESIÓN MÚLTIPLE Y ANÁLISIS DE CORRELACIÓN.

2.1 Introducción.

El análisis de regresión múltiple está basado en las mismas suposiciones y procedimientos de la regresión simple. Su ventaja principal es que nos permite utilizar más de una variable independiente para estimar la variable dependiente, aumentando con ella la precisión de la estimación.

Imagine un agente de bienes y raíces que desea relacionar el número de casas que vende en un mes con la cantidad de su publicidad mensual. Aquí se puede encontrar una ecuación sencilla que relaciona estas dos variables, ¿podemos obtener mayor precisión en nuestra ecuación incluyendo otra variable más, como el número de vendedores que se emplea cada mes?

La respuesta es sí, pero ahora debemos correlacionar el número de agentes de ventas como los gastos de publicidad para predecir las ventas mensuales de las casas. En este caso se debe utilizar regresión múltiple y no lineal.

La regresión múltiple y el análisis de correlación implican un proceso de tres pasos, los cuales son:

1. Describir la ecuación de regresión múltiple.

2. Examinar el error estándar de regresión múltiple de la estimación.

3. Utilizar el análisis de regresión múltiple, para ver que tan bien describe la ecuación de regresión los datos observados.

Además, en la regresión múltiple podemos observar cada una de las variables independientes y probar si contribuyen significativamente a la forma en que la regresión describe los datos.

El tema contempla el estudio de los coeficientes de correlación y determinación simple, coeficientes de determinación y correlación parcial, coeficientes de determinación y correlación múltiple, obtención de la ecuación que mejor se ajusta a los valores observados, error estándar de estimación, intervalos de confianza, análisis de varianza de la regresión múltiple, validación del modelo y empleo del software minitab.

2.2 Coeficientes de correlación.

La correlación entre dos variables, pasando por alto cualesquiera otras variables que pueden variar simultáneamente, recibe el nombre de correlación simple o lineal.

La correlación entre dos variables, cuando una o más variables permanecen fijas a un nivel constante, se denomina correlación parcial.

La relación combinada entre una variable dependiente y dos o más variables que varían simultáneamente recibe el nombre de correlación múltiple.

Supóngase que tenemos una variable dependiente Y, y para cada valor de Y existen valores correspondientes de otras dos variables independientes, X1 y X2.

La correlación simple o total entre Y y X1 es el coeficiente de correlación lineal que estudiamos con anterioridad. Por lo tanto la correlación simple de Y con X1, utilizando subíndices explicativos, podemos expresarla de la siguiente manera.

1

Page 23: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________

Análogamente la correlación simple entre Y y la variable independiente X2 se denota por:

La correlación lineal entre las variables independientes X1 y X2 se denomina por:

La correlación parcial entre Y y X1, permaneciendo constante X2, se calcula a partir de las ecuaciones simples anteriores de la manera siguiente.

Análogamente la correlación parcial entre Y y X2, permaneciendo fija X1 se define de la siguiente manera.

El coeficiente de determinación múltiple mide la correlación combinada en porcentaje de X1 y X2

con Y, y este se determina por:

Finalmente el coeficiente de correlación múltiple de X1 y X2 con Y se obtiene sacando la raíz cuadrada al coeficiente de determinación.

2

Page 24: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________

El valor de R es siempre positivo, fluctuando entre cero y uno; además su valor es cuando menos como el menor de los coeficientes simples o parciales. Este hecho sirve como una buena comprobación de los cálculos.

El problema de visualizar tres variables se complica un poco, ya que con tres variables, la relación debe describirse como un plano en el espacio tridimensional. La proyección del elipsoide sobre el plano X1, Y muestra la correlación simple de X1 y Y. Una sección a través del elipsoide paralelo al plano X1, Y proyectado sobre el mismo, mostrará la correlación parcial de X1 con X2 fija, denotada por

Las figuras siguientes muestran gráficamente diversas situaciones. Note como la correlación múltiple puede variar, mientras que la correlación parcial puede ser alta, o viceversa. Pueden incluso la correlación parcial ser diferentes en signo.

DIAGRAMA DE DIVERSAS COMBINACIONES DE CORRELACIÓN PARCIAL Y MÚLTIPLE, INCLUYENDO TRES VARIABLES.

3

Page 25: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________

Ejemplo. La Secretaría de Hacienda está tratando de estimar la cantidad mensual de impuesto no pagado descubierto por su departamento de auditoría; para el caso desea relacionar las horas de trabajo de auditorías de campo, como el número de horas que sus computadoras usan para detectar impuestos no pagados, con el fin de predecir los impuestos reales no pagados por los contribuyentes.

La observación de 10 meses de trabajo ha dado la siguiente información.

HORAS DE TRABAJO DE AUDITORES, COMPUTADORAS E IMPUESTOS NO PAGADOS

Mes Horas de trabajo de auditorias de campo(dos ceros omitidos)

X1

Horas en computadoras

(dos ceros omitidos)X2

Impuestos realesno pagados

(millones de dólares)Y

4

Page 26: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________Enero 45 16 29Febrero 42 14 24Marzo 44 15 27Abril 45 13 25Mayo 43 13 26Junio 46 14 28Julio 44 16 30Agosto 45 16 28Septiembre 44 15 28Octubre 43 15 27

Para visualizar tres variables, la relación debe escribirse en un plano tridimensional que posea profundidad, longitud y ancho. Para tener una idea intuitiva de ésta forma tridimensional, visualice la intersección de los ejes Y, X1 y X2 como el rincón de un cuarto.

La gráfica siguiente presenta los diez puntos tomados de la muestra, algunos se encuentran por encima del plano y algunos otros por debajo, las distancias que existen entre los valores observados (puntos negros) y los valores esperados (puntos blancos) es lo que se conoce como error de estimación.

Ahora el problema consiste en decidir, cuál de los planos posibles que podemos dibujar entre los valores observados será el que mejor se ajuste a los puntos del modelo, ya que por dichos puntos se puede trazar un número ilimitado de ecuaciones.

Para lograr esto, de nuevo utilizamos el criterio de mínimos cuadrados y localizaremos un plano que logre minimizar la suma de los cuadrados de los errores de estimación.

RELACIÓN DE HORAS DE AUDITORIA (X1), HORAS EN COMPUTADORAS (X2) E IMPUESTOS NO PAGADOS (Y)

5

Page 27: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________

Los cálculos de los datos originales para la obtención de los coeficientes de correlación se presentan a continuación.

Con los cálculos anteriores obtenemos los coeficientes de correlación simple, parcial y múltiple de la manera siguiente.

Los coeficientes de correlación y determinación simple son:

El valor anterior significa que existe correlación lineal media entre las horas de trabajo de los auditores y la evasión de impuestos.

6

a + b1X1 + b2X2

Page 28: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________

Este valor nos indica que las horas de trabajo de los auditores nos explican el 25.15% de la variabilidad de los impuestos no pagados.

Existe correlación lineal media alta entre las horas de trabajo de las computadoras y los impuestos no pagados.

Indica que las horas de trabajo de las computadoras nos explican el 59.51% de la variabilidad de la evasión de impuestos.

Existe correlación lineal muy baja (no existe) entre las horas de trabajo de los auditores y las horas de trabajo de las computadoras.

Las horas de trabajo de los auditores nos explican el 3.3% de las horas de trabajo de las computadoras.

Los coeficientes de determinación y correlación parcial son:

Significa que las horas de trabajo de los auditores y los impuestos no pagados, estando fijos las horas de trabajo de las computadoras, nos logran explicar el 33% de la variabilidad de Y.

7

Page 29: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________Lo anterior nos indica que existe correlación parcial media entre las horas de trabajo de los auditores con la evasión de impuestos, permaneciendo constante las horas de trabajo de las computadoras.

Las horas de trabajo de las computadoras y los impuestos no pagados estando fijos las horas de los auditores, nos logran explicar el 63.77 %.

Existe correlación parcial media alta entre las horas de trabajo de computadoras e impuestos no pagados estando fijos las horas de trabajo de los auditores.

Con los valores obtenidos para los coeficientes de correlación simple obtenemos el cálculo del coeficiente de determinación múltiple de la siguiente manera:

Significa que: las horas de trabajo de los auditores con las horas de trabajo de las computadoras cuando se manejan conjuntamente nos explican el 72.8% de la variabilidad de los impuestos no pagados.

Así mismo nos dice que existe un error de estimación del 27.1% = (1 – 0.729)100, el cual lo podemos considerar como grande.

Finalmente el coeficiente de correlación múltiple se obtiene por:

El cual nos indica que existe correlación múltiple alta entre las horas de trabajo de los auditores con las horas de trabajo de las computadoras y los impuestos no pagados cuando se manejan conjuntamente.

Para finalizar este subpunto, se presenta una ecuación general para encontrar el coeficiente de correlación múltiple que incluye m variables independientes.

8

Page 30: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________Su cálculo resulta complicado, pero más difícil es poder visualizar relaciones entre variables que incluyen cuatro o más dimensiones. En su lugar, necesitamos pensar en términos de las ecuaciones antes que en los diagramas.

2.3 Coeficientes de regresión.

Hasta el momento solo hemos visto la estrechez de la relación entre las variables. Deseamos conocer la naturaleza de las relaciones. Para conocer esto necesitamos una ecuación de la forma.

Los términos b1, b2,… reciben el nombre de coeficientes de regresión parcial. La ecuación mejor ajustada de esta forma, será aquella que haga mínima la suma de cuadrados de los errores de estimación . Para encontrar los valores a, b1, b2,… que cumplan este requisito, debemos resolver ecuaciones normales muy parecidas a las ya manejadas.

Los puntos indican como pueden ampliarse estas ecuaciones para incluir a más de tres variables.

2.4 Obtención de la ecuación de regresión.

El cálculo de la ecuación de regresión, la obtenemos al substituir en las ecuaciones normales anteriores los valores originales solicitados, obteniendo en nuestro caso un sistema de tres ecuaciones con tres incógnitas.

Ahora, utilizamos los cálculos obtenidos en el punto 2.2 con los datos originales de X1, X2 y Y, con dichos valores obtenemos un sistema de tres ecuaciones con tres incógnitas desconocidas (a, b1 y b2).

Resolviendo por determinantes el sistema anterior nos da:

Por lo tanto:

a =a = – 20840 / 1508a = – 13.819628

b1 =

b1 = 850 / 1508b1 = 0.563660

9

Page 31: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________

b2 =

b2 = 1658 / 1508b2 = 1.099469

Es recomendable que los valores estimados de: a, b1, b2,… sean substituidos en alguna de las ecuaciones del sistema de donde se obtuvieron, para ver si la igualdad se cumple, si esto sucede, quiere decir que los coeficientes fueron bien estimados.

Luego entonces, la ecuación que describe la relación entre el número de horas de trabajo de auditoria de campo, el número de horas de computación y los impuestos no pagados es:

La interpretación a los coeficientes de regresión obtenidos es:

El valor a = -13.8196 no debe tomarse muy en cuenta en su aparente implicación de que los impuestos no pagados en un mes son negativos en 13 819,600 dólares, si no se realizan horas de trabajo de auditores ni horas de trabajo de las computadoras.

Pero lo que si nos dice el valor de a, es que la ecuación que se ajustó a los puntos del modelo, corta al eje de la ordenada Y en un sistema de tres dimensiones en el punto -13.8.

b1 = 0.56366, significa que por cada 100 horas de trabajo adicional de los auditores ( ), se logran detectar 563,660 dólares de impuestos no pagados, si la otra variable horas de trabajo de las computadoras permanece constante en cualquier nivel.

b2 = 1.099469, significa que por cada 100 horas de trabajo adicional de las computadoras ( 2X ) se logra detectar 1 099,469 dólares de impuestos no pagados, si las horas de trabajo de los auditores permanece constante en cualquier nivel.

Ahora bien el departamento de auditoria puede con la ecuación estimada, hacer predicciones en un mes en particular para estimar la cantidad de impuestos no pagados, variando a placer tanto la variable como la .

Suponga que el departamento de auditoría desea aumentar la cantidad de sus descubrimientos de impuestos no pagados durante el siguiente mes. Como los auditores entrenados son escasos el departamento no tiene la intención de contratar personal adicional. Por lo tanto, el número de horas de trabajo en auditorías de campo, permanecerá en el nivel de octubre, alrededor de 4,300 horas. Pero con el fin de aumentar sus hallazgos de impuestos no pagados, el departamento de auditoría espera aumentar el número de horas en computadora a aproximadamente 1,600, por lo tanto:

X1 = 43 4300 horas de auditoría de campo.X2 = 16 1600 horas de tiempo de computadora.

Sustituyendo valores en nuestra ecuación estimada tenemos.

10

Page 32: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________En consecuencia, el pronóstico para el mes de noviembre que el departamento de auditoría espera, es de una evasión de impuestos de aproximadamente 28 millones de dólares, para esta combinación de factores.

2.5 Error estándar de estimación.

La medida de dispersión para cuantificar la relación entre tres variables es el error estándar de estimación, el cual se define como:

Donde:Y = valor de la variable dependiente.

= valores estimados a partir de la ecuación de regresión.

n = número de observaciones de la muestra.

k = total de variables independientes.

El cuadro siguiente muestra los valores estimados para cada combinación de variable, así como la suma de cuadrados de las desviaciones.

X1 X2 Y

45 16 29 29.13 – 0.13 0.016942 14 24 25.24 – 1.24 1.537644 15 27 27.47 – 0.47 0.220945 13 25 25.84 – 0.84 0.705643 13 26 24.71 1.29 1.664146 14 28 27.50 0.50 0.250044 16 30 28.57 1.43 2.044945 16 28 29.13 – 1.13 1.276944 15 28 27.47 0.53 0.280943 15 27 26.90 0.10 0.0100

8.0078

Puede observarse que la suma de las desviaciones es cero tal como debe ser, esto suministra una buena comprobación de los cálculos. La suma de cuadrados de la desviación es 8.0078. Esto representa la variación de los impuestos reales no pagados (Y), no asociado con la variación de horas de trabajo de auditoria de campo (X1) o de horas de computadora (X2).

Por lo tanto el error estándar de estimación será:

Es decir se tendrá un error de 1 069,566 dólares

NOTA: La suma de desviaciones al cuadrado también puede calcularse de la siguiente manera:

11

Page 33: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________

Valor muy parecido a 8.0078, la pequeña diferencia es debido al ajuste de decimales. Lo anterior nos permite verificar si los cálculos obtenidos en los coeficientes de correlación simple, parcial, múltiple y la ecuación estimada están correctos.

2.6 Intervalo de confianza para Y.

De manera general un intervalo de confianza alrededor de un valor estimado , se define por:

La probabilidad de que éste intervalo contenga el valor estimado de , es 1 – . Donde t es un valor

de Student con k igual al número de variables independientes y es el error estándar de la ecuación obtenida.

Ejemplo. Se desea un intervalo de confianza al 95%, para la estimación de impuestos no pagados en el mes de noviembre obtenido en el punto 2.4, donde se tenían 4,300 horas de trabajo en auditorías de campo y 1,600 horas de tiempo de computadora, donde fue de 28 011,500 dólares como estimación del descubrimiento de impuestos no pagados.

Dado que deseamos construir un intervalo de confianza para 28 011,500 dólares con un 95% de probabilidad, esto implica un = 0.05. Por lo tanto el valor de t localizado en la tabla de Student es

, mientras que el valor de fue 1 069,566 dólares, por lo tanto el intervalo será:

Lo que significa que con un 95% de confianza, el Departamento de Auditoria puede sentirse seguro de que los descubrimientos reales de evasión de impuestos estarán entre 25.5 y 30.5 millones de dólares. Asimismo el intervalo nos sugiere que se tiene un error de estimación del 9% (2 529,524 / 28 011,500)(100).

2.7 Análisis de varianza de la regresión múltiple.

La prueba de la significancia de la regresión, más que una prueba de significancia de los coeficientes individuales, requiere probar la hipótesis de que todos los coeficientes de la regresión son cero y que, por lo tanto, ninguna de las variables independientes ayuda a explicar la variación de la dependiente.

Los resultados que se han obtenido hasta esta parte, pueden resumirse en un análisis de varianza como se indica a continuación; con la restricción de que debe hacerse un análisis de variación para cada variable independiente, con el fin de saber que variable realmente influye significativamente en la correlación.

12

Page 34: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________

En el ejemplo que venimos estudiando, veremos mediante el análisis de variación (ANOVA) cuales variables independientes son las que realmente influyen en la correlación, esto es con la finalidad de que si tenemos varias variables independientes podemos quitar aquellas que no influyen significativamente. Para el caso nos apoyamos en los coeficientes de correlación obtenidos con anterioridad.

Las fuentes de variación para el análisis de varianza, las sumas de cuadrados y grados de libertad, cuando se analiza la primera variable independiente son:

Fuente devariación

Suma decuadrados

Gradosde libertad

Cuadradomedio F

Regresión debido a 1

Desviación de la regresiónsimple.

(n – 1 ) – 1

Regresión adicional debido

a 1

Desviación de la regresiónmúltiple.

(n – 1 ) – 2

Total n – 1

Donde

De manera análoga las sumas de cuadrados para la segunda variable independiente son:

Fuente devariación

Suma decuadrados

Gradosde libertad

Cuadradomedio F

Regresión debido a 1

Desviación de la regresiónsimple.

(n – 1 ) – 1

Regresión adicional debido

a 1

Desviación de la regresiónmúltiple.

(n – 1 ) – 2

13

Page 35: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________

Total n – 1

Las sumas de cuadrados y los grados de libertad para el ANOVA de la variable horas de trabajo de auditoria ( ) son:

Suma de cuadrados total.

, con 10 – 1 = 9 grados de libertad.

Suma de cuadrados de la regresión debido a = (0.2515) 29.6 = 7.44, con 2 – 1 = 1 grado de libertad.

Suma de cuadrados de la desviación de la regresión simple= (1 – 0.2515) 29.6 = 22.15, con (10 – 1) – 1 = 8 grados de libertad.

Suma de cuadrados de la regresión adicional debido a = (0.6377) (1 – 0.2515) 29.6 = 14.13, con 2 – 1 = 1 grado de libertad.

Suma de cuadrados de la desviación de la regresión múltiple= (1 – 0.7288) 29.6 = 8.03, con (10 – 1) – 2 = 7 grados de libertad.

Concentrando las sumas de cuadrados y los grados de libertad en la tabla siguiente, obtenemos los cuadrados medios (varianzas) para cada fuente de variación, para finalmente obtener las F calculadas para cada variable independiente.

ANÁLISIS DE REGRESIÓN MÚLTIPLE DE IMPUESTOS NO PAGADOS CONSIDERANDO EL EFECTO TOTAL DE HORAS DE AUDITORIA Y LUEGO EL EFECTO ADICIONAL DE HORAS DE COMPUTADORA.

Fuente devariación

Suma de cuadrados

Grados de libertad

Cuadrado medio F

Regresión debido a 7.44 1 7.44 2.68

Desviación de la regresión simple. 22.15 8 2.77

Regresión adicional debido a 14.13 1 14.13 12.29

Desviación de la regresión múltiple. 8.03 7 1.15

Total 29.6 9

Para poder decidir si la variable independiente influye de manera significativa en la variable dependiente Y, primero debemos plantear las siguientes hipótesis de trabajo.

: La variable independiente horas de trabajo de los auditores, no influye de manera significativa en los impuestos no pagados.

: La variable independiente horas de trabajo de los auditores, si influye de manera significativa en los impuestos no pagados.

14

Page 36: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________Para decidir si se acepta o rechaza la hipótesis , se debe considerar la probabilidad de ocurrencia de la F obtenida en el análisis de varianza. Si la probabilidad de obtener una F igual a la de la muestra es menor que 0.05 se rechaza la hipótesis H0.

La probabilidad de obtener una F = 2.68 con un grado de libertad en el numerador y ocho en el denominador para la variable , se obtiene de la tabla F de Fisher para diferente valores de

= 0.10 = 0.05 = 0.01

8 3.46 5.32 11.26

Podemos apreciar que la probabilidad de tener un valor de F = 2.68 es mayor a 0.10 o lo que es lo mismo es mayor a 5%, por lo tanto, se acepta la hipótesis y se concluye que la variable horas de trabajo de los auditores no influye de manera significativa en los impuestos reales no pagados.

Una manera práctica para tomar esta misma decisión es: Si F es mayor que se rechaza la hipótesis ; en nuestro caso como F = 2.68 es menor que , se acepta

la hipótesis y se concluye que las horas de trabajo de los auditores no influyen de manera significativa en los impuestos no pagados.

Las sumas de cuadrados para la segunda variable independiente horas empleadas en computadora (), así como el ANOVA correspondiente se presentan a continuación.

Suma de cuadrados total = 29.6

Suma de cuadrados de la regresión debido a = 0.5951 (29.6) = 17.61

Suma de cuadrados de la desviación de la regresión simple= (1 – 0.5951) 29.6 = 11.99

Suma de cuadrados de la regresión adicional debido a = 0.3303 (1 – 0.5951) 29.6 = 3.96

Suma de cuadrados de la desviación de la regresión múltiple(1 – 0.7288) 29.6 = 8.03

ANÁLISIS DE REGRESIÓN MÚLTIPLE CONSIDERANDO EL EFECTO TOTAL DE HORAS EN COMPUTADORA Y LUEGO EL EFECTO ADICIONAL DE HORAS DE AUDITORIA.

Fuente devariación

Suma de cuadrados

Grados de libertad

Cuadrado medio F

Regresión debido a 17.61 1 17.61 11.74

Desviación de la regresión simple. 11.99 8 1.50

Regresión adicional debido a 3.96 1 3.96 3.44

Desviación de la regresión múltiple. 8.03 7 1.15

Total 29.6 9

15

Page 37: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________

Dado que la probabilidad de tener una F = 11.74 con y para la variable independiente , es menor de 0.01 (ver tabla anterior), se rechaza la hipótesis : La variable independiente

horas de trabajo de las computadoras, no influye de manera significativa en los impuestos no pagados y se acepta la hipótesis alterna : La variable independiente horas de trabajo de las computadoras, si influye de manera significativa en los impuestos no pagados. Con lo que se concluye que las horas de trabajo de las computadoras si influyen significativamente en la estimación de los impuestos reales no pagados.

NOTAS: La suma de cuadrados de la desviación de la regresión simple, se puede calcular por diferencia de la S. C. Total menos S. C. de la regresión debido a . Ejemplo para el primer análisis. 29.6 – 7.44 = 22.16

La suma de cuadrados de la desviación de la regresión múltiple, se puede calcular por diferencia de la S. C. de la desviación de la regresión simple menos S. C. de la regresión adicional debido a . Ejemplo para el segundo análisis. 11.99 – 3.96 = 8.03

Puede observarse que en ambos análisis, la suma de cuadrados de la desviación de la regresión múltiple (8.03) es idéntico a ; así mismo el cuadrado medio de la desviación de la

regresión múltiple (1.15) es idéntico a obtenido en el punto 2.5.

2.8 Coeficiente de determinación.

De los análisis anteriores también lo podemos obtener de la siguiente manera:

Lo que significa que las variables horas de auditoría de campo ( ) y horas en computadoras ( ) unidas, logran explicar el 72.9% de la variabilidad de Y.

Por otra parte las horas de auditoría de campo de manera individual logran explicar el 25.13% de la variabilidad de Y, (7.44 / 29.6) 100.

Mientras que las horas de computadora de manera individual logran explicar el 59.49% de la variabilidad de Y, (17.61 / 29.6) 100.

Los valores calculados anteriormente coinciden con los coeficientes de correlación obtenidos con anterioridad, que fueron , y .

2.9 Validación del modelo.

2.9.1 Análisis residual.

Los residuos o errores de estimación en la regresión múltiple se definen por , los cuales juegan un papel importante en la validación del modelo, de igual forma como sucede en la regresión simple.

Los supuestos del error en el modelo de regresión múltiple son análogos a las suposiciones del modelo de regresión lineal simple, siendo estos:

1. Los errores son variables aleatorias con promedio igual a cero.2. Las varianzas de los errores es la misma para todas las variables independientes.

16

Page 38: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________3. Los errores son independientes.4. Los errores son variables independientes que se distribuyen normalmente.

Es conveniente graficar los residuos contra , y , así como obtener la gráfica de probabilidad normal de los residuos. En el ejemplo que nos ocupa los residuos son:

45 42 44 45 43 46 44 45 44 43

16 14 15 13 13 14 16 16 15 15

29 24 27 25 26 28 30 28 28 27

29.13 25.24 27.47 25.84 24.71 27.50 28.57 29.13 27.47 26.90

-0.13 -1.24 -0.47 -0.84 1.29 0.50 1.43 -1.13 0.53 0.10

La gráfica de residuos ( ) contra las horas de trabajo de los auditores ( ) se presenta a continuación, en ella se puede observar que no hay un patrón definido, así mismo observamos que no hay valores atípicos u observaciones inusuales.

GRÁFICA DE RESIDUOS CONTRA HORAS DE TRABAJO DE AUDITORES

En la gráfica de residuos ( ) contra las horas de trabajo de las computadoras ( ), se puede observar que no hay un patrón definido ni observaciones inusuales en relación con el resto de los datos.

GRÁFICA DE RESIDUOS CONTRA HORAS DE TRABAJO DE COMPUTADORAS

17

Page 39: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________

Como no hay un patrón en ambas gráficas podemos concluir que hay independencia entre los errores, que son aleatorios y que su media es cero.

En la gráfica de residuos ( ) contra valores estimados ( ) se puede observar que los residuos no aumentan conforme crece , lo que nos indica que las varianzas de los errores es la misma para todas las variables independientes.

Cuando la dispersión de los residuos aumenta conforme aumenta indica que al menos una varianza no es constante. Si las suposiciones para el modelo de esta prueba no se satisfacen, entonces no se justifica sacar conclusiones acerca de la significación estadistica de la ecuación estimada. Cuando una varianza no es constante se sugiere trasformar la variable dependiente a logaritmos para analizarla bajo otra métrica, esto hace que los valores de la variable dependiente se compriman y con esto disminuirán los efectos de la varianza no constante.

GRÁFICA DE RESIDUOS CONTRA VALORES AJUSTADOS

18

Page 40: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________

En la gráfica de probabilidad normal de los residuos, encontramos que no hay desviaciones marcadas de la normalidad que se perciban, por lo tanto el supuesto de que los errores se distribuyen de manera normal se cumple.

Dado que los supuestos en que se basa el modelo se cumplen, podemos concluir que no existe insuficiencia del modelo, es decir nuestro modelo es válido.

19

Page 41: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________Apéndice 2.1 Empleo del software Minitab en regresión múltiple.

Para ilustrar el empleo del software Minitab en la elaboración del análisis de regresión múltiple, utilizaremos el ejemplo de la Secretaría de Hacienda, de horas de trabajo de auditores, horas de trabajo de las computadoras e impuestos no pagados. Los pasos a seguir pueden ser:

1. En la columna C1 de la hoja de cálculo, rotule X1 en C2 X2 (predictoras) y en C3 Y (respuesta). 2. La manera como son concentradas las variables predictoras y la variable respuesta, puede ser.

X1 X2 Y1 45 16 292 42 14 243 44 15 274 45 13 255 43 13 266 46 14 287 44 16 308 45 16 289 44 15 2810 43 15 27

3. Seleccione el menú Estadísticas.

4. Seleccione el menú Regresión.

5. Hacer clic en Regresión.

6. Cuando aparezca el cuadro de diálogo Regresión: Ingresar C3 en el cuadro de Respuestas. Ingresar C1 en el cuadro Predictores. Ingresar C2 en el cuadro Predictores.

Hacer clic en el cuadro de Gráficas.

7. Cuando aparezca el cuadro de diálogo Regresión-Gráficas: Hacer clic en al botón Gráficas individuales. Hacer clic en el cuadro Gráfica normal de residuos. Hacer clic en el cuadro Residuos vs ajustes. Hacer clic en el cuadro Residuos vs las variables: Ingresar X1 en el cuadro Residuos vs las variables. Ingresar X2 en el cuadro Residuos vs las variables. Hacer clic en Aceptar. Hacer clic en el cuadro de Resultados.

8. Cuando aparezca el cuadro de diálogo Regresión-Resultados: Hacer clic en el botón Ecuación de regresión, tabla de coeficientes, s, R-cuadrado y análisis básico de varianza. Hacer clic en Aceptar. Hacer clic en el cuadro de Almacenamiento.

9. Cuando aparezca el cuadro de diálogo Regresión-Almacenamiento: Hacer clic en el cuadro Residuos. Hacer clic en el cuadro Ajuste. Hacer clic en Aceptar. Hacer clic en Aceptar.

En los cuadros de diálogo, Minitab tiene otras posibilidades más que usted puede aprovechar seleccionando las opciones que desee.

20

Page 42: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Regresión múltiple________________________________________________________________________________________

21

Page 43: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

3. DISEÑO DE EXPERIMENTOS

3.1 Introducción.

El diseño de experimentos está basado en el método científico que nos permite entender y mejorar los procesos, mediante la búsqueda planeada de los factores que afectan las variables que mejor representan el proceso.

Un experimento es una prueba o serie de pruebas en las cuales se inducen cambios deliberados en las variables de entrada de un proceso o sistema, de manera que sea posible identificar y cuantificar las causas de los cambios en la variable de salida.

Entre los objetivos del experimento pueden citarse:

1. Determinar cuáles variables tienen mayor influencia en la variable de salida.

2. Determinar el nivel de las variables de entrada al que se obtiene el nivel deseado de las variables de salida.

3. Determinar el nivel de las variables de entrada al que se obtiene la menor variabilidad en las variables de salida.

4. Determinar el nivel de las variables de entrada al que minimicen los efectos de las variables de ruido o incontrolables.Dentro de las aplicaciones inmediatas al emplear un diseño experimental, por citar algunas tenemos: Aumento de la producción, disminución de los costos de producción, mejorar la calidad de los equipos, verificar si las líneas de producción trabajan al mismo ritmo así como reducir los niveles de contaminación en los procesos industriales.

La unidad contempla los términos más comunes empleados en el tema de diseños experimentales, así como consejos prácticos en la instalación de un experimento.

3.2 Términos más comunes utilizados en diseño de experimentos.

Unidad experimental.

División más pequeña de material a la que el tratamiento es aplicado. El efecto de tratamiento es evaluado en la unidad de muestreo, que puede ser una muestra aleatoria de unidades experimentales, o corresponder a una sola unidad experimental.

1

Page 44: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ Factores, tratamientos o variables independientes.

Son las variables de entrada en un experimento, cuyo efecto se quiere determinar sobre la variable de respuesta. Tienen las características de ser medibles, controlables y de influencia muy pronunciada en la variable de respuesta.

Variables de respuesta.

Son las variables de salida en un experimento. Dentro de las características que se desean en una variable de respuesta son: 1. Debe expresarse en unidades apropiadas.

2. Debe reflejar una cantidad o calidad de interés en la unidad experimental.

3. Debe estar asociada con un blanco o condición deseable (lo que motiva el experimento).

4. Preferentemente obtenida por métodos no destructivos o que dañen las unidades experimentales, de tal forma que mediciones repetidas puedan ser hechas.

5. No deben estar cerca de un límite natural.

6. Debe tener varianza constante.

Repetición.

Aplicación de un tratamiento de manera independiente a cada unidad experimental.

Variables controlables.

Son aquellas cuyos efectos no son de interés en el experimento, por lo que se mantienen constantes, para no tener factores extraños que distorsionen los resultados.

Variables incontrolables (factores superfluos)

No son de interés primario en el experimento. Si no es medible y se considera que influye sobre la variable de respuesta, puede llegar a ser un factor de riesgo experimental. Tales factores pueden inflar el error experimental o sesgar los resultados.

Si es medible, y puede seleccionarse el nivel en cada unidad experimental, entonces el bloqueo puede ser apropiado. Por el contrario, si es medible, pero los niveles no pueden ser seleccionados, entonces los factores superfluos llegan a ser una covariable.

2

Page 45: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

3.3 Clasificación de los factores o tratamientos de acuerdo a sus niveles.

Factor cualitativo:

Factores cuyos niveles no pueden ser arreglados en orden de magnitud. Los cuales pueden presentarse sin estructura (ejemplo, se comparan tres variedades de trigo) y con estructura (ejemplo, se comparan cinco tipos de lavadoras donde dos son de fabricación nacional y tres de fabricación extranjera). El interés en estos factores se centra en comparación de medias.

Factor cuantitativo:

Factores cuyos niveles están asociados con puntos en una escala numérica. Pudiendo ser estos igualmente espaciados o equidistantes (ejemplo se comparan cuatro concentraciones e nitrógeno 0, 5, 10 y 15%), o no equidistantes (ejemplo se comparan tres concentraciones de madera dura (5, 10 y 20%). El interés es la relación de los niveles de factor con la variable de respuesta.

Dentro de los principios generales para la selección práctica de niveles tenemos:

1. Es necesario saber que clase de modelo es apropiado para el análisis de resultados y ser capaz de definir el rango de niveles de factor para los cuales el modelo es válido.

2. Los niveles seleccionados pueden cubrir el rango máximo de los niveles del factor para los que el supuesto modelo se considera que es apropiado.

3. El número de niveles debe ser igual al número de parámetros en el modelo que se va a ajustar o uno más.

En la práctica modelos de más de cuatro parámetros para un factor singular no son informativos, y el número de niveles para un factor cuantitativo debe casi invariablemente ser de tres o cuatro. En general deben ser igualmente repetidos.

3.4 Repetición y error experimental.

La repetición de un tratamiento consiste en aplicar de nuevo este tratamiento a otra unidad experimental. Así si tenemos r repeticiones de un tratamiento, esto indica que dicho tratamiento ha sido aplicado independientemente a r unidades experimentales.

La principal función de la repetición es proporcionar un estimador de error experimental, el cual surge de las variables no controladas (variables de ruido) o en la falta de uniformidad en la conducción física del experimento.

3

Page 46: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ El número de repeticiones a utilizar en un experimento depende de: La precisión, entre mayor precisión se requiera más repeticiones deben utilizarse. El presupuesto, entre mayor sea el número de repeticiones más caro es el costo del experimento. En la práctica por lo general se emplean de cuatro a nueve repeticiones.

El error experimental es evaluado a través de los residuales, cuyo patrón refleja la consistencia de los efectos del tratamiento. Un tratamiento con residuos muy pequeños muestra efectos muy similares en todas las repeticiones, en tanto que aquel con grandes residuos tiene efectos discrepantes en las unidades experimentales. Así, el error debe ser interpretado como una medida de consistencia.

3.5 Criterios para buenos diseños experimentales.

1. El análisis resultante del diseño debe proporcionar información no ambigua de los objetivos primarios del experimento. El diseño debe conducir a estimadores insesgados.

2. El modelo y sus suposiciones deben ser apropiadas para el material experimental.

La técnica empleada para el análisis de un experimento, se conoce como análisis de varianza (ANOVA) y está diseñada específicamente para probar si las medias de más de dos poblaciones son iguales o diferentes. Consiste en partir la suma de cuadrados del total de un experimento, en varias partes, para decidir si o no ciertos factores introducidos en el diseño experimental producen resultados significativamente diferentes en la variable de entrada.

3. El diseño debe proporcionar máxima información con respecto a los objetivos principales del experimento por mínima cantidad de esfuerzo experimental.

4. El diseño debe proporcionar algo de información con respecto a todos los objetivos del experimento.

5. El diseño debe tener posibilidad dentro de las condiciones de trabajo del experimentador.

3.6 Consejos prácticos para la instalación de un experimento.

1. Comprensión y planteamiento del problema.

Es necesario desarrollar todas las ideas sobre los objetivos del experimento. Suele ser importante solicitar la opinión de todas las partes implicadas: cuerpo técnico, aseguramiento de la calidad, manufactura, división comercial, dirección, clientes y personal operativo (quienes normalmente saben mucho del asunto pero son con demasiada frecuencia ignorados).

2. Elección de factores y niveles.

4

Page 47: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ El experimentador debe considerar los factores que variarán en el experimento, los intervalos de dicha variación y los niveles específicos a los cuales se hará el experimento.

3. Selección de la variable de respuesta.

Al seleccionar la respuesta o variable dependiente, el experimentador debe estar seguro de que la respuesta que se va a medir realmente provea información útil acerca del proceso del estudio.

4. Elección del diseño experimental.

Si los tres pasos anteriores se han seguido de manera correcta, este cuarto paso es relativamente fácil. Para elegir el diseño es necesario considerar el tamaño muestral (número de repeticiones), seleccionar un orden adecuado para los ensayos experimentales, y determinar si hay implicado bloqueo u otras restricciones de aleatorización.

5. Realización del experimento.

Cuando se realiza el experimento, es vital vigilar el proceso para estar seguro que todo se haga bajo lo planeado. En esta fase, los errores en el procedimiento suelen anular la validez experimental.

6. Análisis de datos.

Deben emplearse métodos estadísticos para analizar los datos de modo que los resultados y conclusiones sean objetivos más que apreciativos.

7. Conclusiones y recomendaciones.

Una vez que se han analizado los datos, el experimentador debe extraer conclusiones prácticas de los resultados y recomendar un curso de acción. En esta fase a menudo son útiles los métodos gráficos, en especial al presentar los resultados a otras personas.

El siguiente esquema representa un experimento, el cual no es más que un proceso en el que intervienen diferentes tipos de variables.

5

Page 48: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

VARIABLES DE INVESTIGACIÓN

6

Page 49: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

4. DISEÑO COMPLETAMENTE AL AZAR

4.1 Introducción.

VARIABLES INDEPENDIEN-

TES

VARIABLES INCONTROLA-

BLES

VARIABLES DE RESPUESTA

VARIABLES CONTROLA-

BLES

PROCESO

UNIDADES EXPERIMENTA-

LESHOMOGÉNEAS

7

Page 50: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ Un diseño completamente azarizado, es un modelo en el cual los tratamientos son asignados completamente al azar a las unidades experimentales o viceversa, donde las unidades experimentales deben ser lo más homogéneo posible.

El análisis puede realizarse con variables de salida obtenidas de un diseño controlado o de muestras aleatorias de poblaciones.

Debido a su simplicidad el diseño completamente al azar es usado ampliamente. Sin embargo el investigador debe ser cauteloso de que su uso debe limitarse a casos en los cuales se dispone de unidades experimentales homogéneas.

Dentro de las ventajas de este tipo de diseño están:

1. Permite flexibilidad completa; puede usarse cualquier número de tratamientos o repeticiones; puede variarse a voluntad el número de repeticiones de un tratamiento a otro; todo el material experimental disponible puede utilizarse.

2. El análisis estadístico es fácil aún cuando los errores experimentales difieren de un tratamiento a otro.

3. Aún cuando los datos de algunas unidades o algunos tratamientos completos se hayan perdido, o se rechacen por alguna causa, el análisis sigue siendo fácil.La objeción principal de los diseños completamente al azar estriba en su grado de precisión, ya que la aleatorización no se restringe en ninguna forma para asegurar que las unidades que reciben un tratamiento sean similares a aquellas que reciben otro tratamiento. Toda la variación que existe entre las unidades experimentales pasa a formar parte del error experimental.

En esta unidad se contempla: Ejemplos de instalación de diferentes tipos de experimentos, planteamiento de hipótesis de trabajo, análisis de varianza para un experimento balanceado y desbalanceado así como análisis residual para validar el modelo.

4.2 Ejemplos de la instalación de experimentos completamente al azar.

Ejemplo 1. Se desean probar tres tipos diferentes de hormonas para determinar el aumento de peso en las ovejas, además se decide tener un testigo (control) o sea que dispone de cuatro tratamientos (A, B, C y D), y se cuenta con 16 grupos de ovejas.

8

Page 51: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ Numeramos del 1 al 16 los grupos de ovejas y con el auxilio de la calculadora científica o con la tabla de números aleatorios seleccionamos cuatro números al azar entre 01 y 16, suponga que son 14, 13, 02 y 08 a estos grupos de ovejas se les asigna el tratamiento A. Nuevamente se seleccionan otros cuatro números sin considerar los que ya salieron a éstos se les asigna el tratamiento B y así sucesivamente.

Ejemplo 2. Se desean probar cuatro niveles de concentración de madera dura: 5, 10, 15 y 20%, para la elaboración de bolsas de papel para envasar comestibles. Para el caso se dispone de seis bolsas para cada tratamiento, las que se realizaron en una planta piloto. Las 24 bolsas se numeran del 01 al 24 y en forma completamente al azar se mide la resistencia de cada una de ellas en un probador de tensión.

Ejemplo 3. Se desean probar tres variedades de alfalfa más un testigo: V1, V2, V3, T (cuatro tratamientos). Para el caso se dispone de 18 parcelas relativamente homogéneas y se desea tener más información de la variedad primera.

Una manera como puede resolverse este problema es asignando cuatro parcelas completamente al azar a las variedades V2, V3, y T, mientras que a la variedad V1 se le asignarán seis parcelas de manera aleatoria.

4.3 Prueba de hipótesis en el análisis de varianza (ANOVA).

Si i denota la media de la i-ésima población y 2 indica la varianza común de las t poblaciones, podemos expresar cada observación yij como i más el efecto del tratamiento más el valor de un componente aleatorio; es decir podemos escribir el modelo de la manera siguiente:

Para i = 1, 2,..., t tratamientos y j = 1, 2,..., r repeticiones La hipótesis a probar de acuerdo al modelo anterior es:

H0: 1 = 2 = . . . = t H1: i ≠ j para alguna i , j

También pueden formularse hipótesis de acuerdo al tratamiento:

H0: t1 = t 2 = . . . = t t H1: t i ≠ t j para i , j

Otra manera de plantear las hipótesis son:

H0: No existe diferencia entre tratamientos. H1: Si existe diferencia entre tratamientos.

9

Page 52: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ Una manera más de plantearlas es:

H0: Los tratamientos son iguales.H1: Al menos dos tratamientos son diferentes.

4.4 Suposiciones en que se basa el ANOVA en un diseño completamente al azar.

Para probar las hipótesis de que las muestras se obtuvieron de k poblaciones normales con medias iguales, el ANOVA parte de las siguientes suposiciones:

1. Los efectos de tratamientos y del error son aditivos.

2. En relación a los residuos (errores) tenemos:

a). son variables aleatorias con media igual a cero.b). se distribuyen normalmente.c). son independientes ( o sea que entre error y error hay independencia).d). Los errores tienen una varianza común. V ( ) = 2 para todo i , j 3. Las varianzas de los tratamientos son estadísticamente iguales. Esto puede comprobarse mediante la prueba de Bartett para homogeneidad de varianzas, en caso de que las varianzas sean diferentes, entonces la transformación de los datos a logarítmos es lo más recomendable. 4. La variable de salida (datos) se distribuyen de manera normal.

En la práctica nunca se está seguro de que todas estas suposiciones se cumplen, si una o más de estas suposiciones no se satisfacen, se ve afectado el nivel de significancia y la sensibilidad de la prueba F o t.

Esto trae como consecuencia el rechazo de la hipótesis H0 cuando ésta es cierta, o sea se determinan más diferencias no existentes entre tratamientos.

Si el experimentador piensa estar usando 5%, en realidad el nivel que está empleando es del 7 u 8%.

En los casos donde se detecten este tipo de anomalías, se pueden utilizar las siguientes medidas para su corrección.

Bajar el nivel de significancia (2.5 o 3%) para que la prueba sea más o menos al 5%, los otros procedimientos son básicamente la transformación de los datos originales de acuerdo a las suposiciones que no se cumplen.

La transformación de las variables juega un papel muy importante en el cumplimiento de estas suposiciones. Por ejemplo si se tienen datos en porcentaje, éstos no se

10

Page 53: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ distribuyen normalmente lo más conveniente es transformarlos a arcoseno, si los datos que se analizan son pequeños con decimales, lo más recomendable es transformarlos a raíz cuadrada y si la variable analizada es un cociente de variables se recomienda la transformación a logaritmos, y el análisis se realiza como si fueran datos originales.

4.5 Ejemplo de ANOVA en un diseño completamente al azar.

El análisis de varianza está diseñado para probar si las medias de dos o más poblaciones son iguales estadísticamente. El análisis pude realizarse con datos obtenidos bajo un diseño experimental o con muestras de diferentes poblaciones.

La técnica consiste partir la suma de cuadrados de la variable de salida en varias partes, para decidir, si o no, ciertos factores introducidos en el experimento producen resultados significativamente diferentes en la variable de entrada.

La prueba se basa en el cociente de dos varianzas, si el cociente es cercano a uno las medias poblacionales son iguales, cuanto más difiere de uno, mayor es la probabilidad de que las medias poblacionales sean diferentes.

Si los resultados de un experimento completamente aleatorio nos dan los siguientes valores, el análisis estadístico se procede como se muestra a continuación:

TratamientosI II

Repeticiones:III r

Total Promedio

T1 y11 y12 y13 . . . y1r

T2 y21 y22 y23 . . . y2r

. . . . . . .

. . . . . . .

. . . . . . .Tt yt1 yt2 yt3 . . . ytr

Total . . . = i = 1, 2, …, t tratamientos j = 1, 2, …, r repeticiones

Se suma sobre j ∴

Se suma sobre i ∴

11

Page 54: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

Suma de totales ∴

El análisis de varianza para este tipo de modelo se presenta en la tabla siguiente:

Fuente de Suma de Grados de Cuadrado Fvariación cuadrados libertad medio

Tratamientos t - 1

Error Exptal. t (r - 1)

Total r t - 1

Para decidir si los tratamientos son iguales o diferentes estadísticamente, se saca la probabilidad de tener una F igual a la obtenida en el ANOVA. Si su probabilidad es menor a 5% se rechaza H0 (los tratamientos son iguales) y se acepta H1 (los tratamientos son diferentes).

Ejemplo 1. El departamento de Ingeniería de productos, llevó a cabo un experimento para probar la resistencia de bolsas de papel para envasar comestibles. Dicho experimento se realizó con cuatro niveles de concentración de madera dura 5, 10, 15 y 20% con seis repeticiones para cada tratamiento. Los resultados de las pruebas en un probador de tensión de laboratorio son los siguientes expresados en libras por pulgada cuadrada (psi).

C 14 D 19 B 12 D 25D 22 A 7 C 18 B 17A 8 C 19 A 15 B 13

12

Page 55: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

C 17 B 18 A 11 D 23A 9 B 19 D 18 C 16D 20 C 18 A 10 B 15

Pruebe la hipótesis a un nivel de significancia del 5%.

Primero ordenamos los datos como se muestra a continuación.

RESISTENCIA A LA TENSIÓN DE LAS BOLSAS DE PAPEL (psi).

RepeticionesTratamientos I II III IV V VI Total PromedioA = 5% 7 8 15 11 9 10 60 10.00B = 10% 12 17 13 18 19 15 94 15.67C = 15% 14 18 19 17 16 18 102 17.00D = 20% 19 25 22 23 18 20 127 21.17Total 52 68 69 69 62 63 383 15.96

Las sumas de cuadrados se obtienen de la siguiente manera:

Factor de corrección = = 3832/6 (4) = 6112.04

Suma de cuadrados totales =

= 72 + 82 +…+ 182 + 202 – FC: = 6625 - 6112.04 = 512.96

Suma de cuadrados de tratamiento =

= (602 + 942 +…+1272) / 6 – FC. = (38969 / 6) - 6112.04 = 382.79

Suma de cuadrados del error = SCT - SC Trat.

= 512.96 - 382.79 = 130.17

Las sumas de cuadrados obtenidas se concentran en la tabla siguiente para su análisis.

13

Page 56: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

ANÁLISIS DE VARIANZA DE LA RESISTENCIA A LA TENSIÓN DEL PAPEL.

Fuente de variación Suma de cuadrados

Grados de libertad

Cuadrado medio

F

Tratamientos382.79 3 127.60 19.6

Error experimental 130.17 20 6.51Total 512.96 23 22.30

Para decidir si los tratamientos son iguales o diferentes, se obtiene la probabilidad de tener una F = 19.6 de la tabla F de Fisher. Si la probabilidad de tener una F igual a la de la muestra es menor al 5 % se rechaza la hipótesis H0.

La manera como se busca la probabilidad en la tabla F es: localizar en la parte superior de la tabla los grados de libertad para el numerador, en nuestro ejemplo v1 = 3: posteriormente se busca en la parte izquierda de la tabla los grados de libertad para el denominador, en nuestro caso v2 = 20. Donde se intercepten imaginariamente v1 y v2 se localiza el valor de F de tablas a un cierto nivel . En nuestro caso es:

v1 = 3v2 = 0.10 = 0.05 = 0.0120 2.38 3.10 4.94

Aquí se puede ver que el valor de F = 19.6 se encuentra a la derecha de 4.94 por lo que le corresponde una probabilidad menor a 0.01.

Puesto que la probabilidad de obtener por azar una F = 19.6 es menor a 5%, rechazamos la hipótesis y aceptamos la hipótesis alterna

, con lo que se puede concluir que los promedios de las resistencias de las bolsas de papel (tratamientos) son diferentes estadísticamente.

En la práctica una manera de concluir lo anterior, es mediante la comparación de la F del análisis de varianza contra una F de tablas a un nivel = 0.05 con v1 y v2 grados de libertad. Si la F calculada es mayor que la F de tablas, se concluye que existe diferencia significativa entre los promedios de los tratamientos.

En nuestro caso podemos observar que F = 19.6 es mayor que F0.05, (3, 20) = 3.10, por lo que podemos concluir que los tratamientos son diferentes estadísticamente.

4.6 Análisis residual y validación del modelo.

En el análisis de varianza se supone que las observaciones se distribuyen de manera normal y que las varianzas de los tratamientos son iguales, así mismo que los residuos se distribuyen normalmente, son independientes y con promedio cero.

14

Page 57: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

Estas suposiciones deben verificarse examinando los residuos, los cuales los definimos como: O sea la diferencia entre el valor observado y su correspondiente promedio de tratamiento.

Para comprobar la suposición de varianzas iguales, se grafican los residuos contra el promedio de tratamiento (tambien conocido como valor ajustado), la variabilidad en los residuos no debe depender de ningún momento del valor de .También es útil grafican los residuos contra los tratamientos para comparar la dispersión de los residuos y ver si se cumplen sus supuestos.

Cuando aparece un patrón en estas gráficas, suele indicar la necesidad de una transformación, es decir, analizar los datos bajo una métrica diferente. Por ejemplo si la variabilidad en los residuos aumenta con entonces debe hacerse transformación logarítmica o , si los datos están en porcentaje se recomienda la transformación arcoseno, si los valores que se analizan son pequeños debe emplearse la transformación a raíz cuadrada y si los valores son el resultado de un cociente de variables estos deben transformarse a logaritmos.

La suposición de independencia puede verificarse graficando los residuos contra el tiempo u orden en el que se ejecutó el experimento. Un patrón en estas gráficas, tal como la secuencia de residuos positivos y negativos, puede indicar que las observaciones no son independientes; esto sugiere que el tiempo u orden de la serie es importante, y no se han incluido en el diseño del experimento.

Continuando con el ejemplo que nos ocupa, obtengamos los residuos para el experimento de la resistencia a la tensión del papel.

RESIDUOS PARA EL EXPERIMENTO DE RESISTENCIA A LA TENSIÓN.

Concentración de madera dura I II

RepeticionesIII IV V VI

A = 5% -3.00 -2.00 5.00 1.00 -1.00 0.00B = 10% -3.67 1.33 -2.67 2.33 3.33 -0.67C = 15% -3.00 1.00 2.00 0.00 -1.00 1.00D = 20% -2.17 3.83 0.83 1.83 -3.17 -1.17

La gráfica de probabilidad normal de los residuos es:

GRÁFICA DE PROBABILIDAD NORMAL DE LOS RESIDUOS

15

Page 58: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

Puede observarse que no hay anormalidad en la gráfica, por lo tanto el supuesto de normalidad de la variable de salida ( ) se cumple.

Una manera práctica para saber si los datos se distribuyen normalmente es mediante la obtención del coeficiente de variación, Donde CME es el cuadrado medio del error del análisis de varianza de los datos.

Un criterio práctico que indica normalidad en los datos, es cuando el coeficiente de variación toma los siguientes valores:

0 a 10% muy confiable la normalidad. 10 a 20% confiable la normalidad. 20 a 30% poco confiable la normalidad. Más de 30% no confiable la normalidad.

En nuestro ejemplo el coeficiente de variación es , lo que nos indica que la normalidad es confiable.

La gráfica de residuos contra tratamientos es:

GRÁFICA DE RESIDUOS CONTRA TRATAMIENTOS.

16

Page 59: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

En esta gráfica se observa que no hay un patrón definido, por lo que podemos decir que existe independencia entre los errores (no hay tendencia entre ellos), además de que el promedio de los residuos es cero (existe igual número de residuos positivos como negativos)

En la gráfica de residuos contra los promedios de tratamientos, se observa que no existe tendencia definida, es decir, la variabilidad de los residuos no aumenta conforme crece , por lo que podemos concluir que las varianzas son iguales para cada tratamiento. Como las gráficas no muestran en ningún momento falta de adecuación del modelo ni algún problema con los supuestos, podemos concluir que los resultados que da el modelo son válidos.

GRAFICA DE RESIDUOS CONTRA PROMEDIOS

4.7 Análisis de varianza en un diseño completamente al azar desbalanceado.

17

Page 60: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ Hay ocasiones en el que el número de parcelas experimentales no alcanza para que todos los tratamientos tengan igual número de repeticiones, o nos interesa más información en particular sobre un determinado tratamiento, o tenemos la necesidad de comparar muestras tomadas de diferentes poblaciones.

Un experimento se puede desbalancear por la pérdida de una unidad experimental, por causas ajenas al efecto del tratamiento como robo, ataque de una plaga o enfermedad, descuido, etc.

También se desbalancea un experimento cuando un tratamiento presenta más variabilidad que los otros, aquí es recomendable utilizar más repeticiones para este tratamiento.

Ejemplo. Como parte de la investigación del derrumbe del techo de un edificio, un laboratorio prueba todos los pernos disponibles que conectaban la estructura de acero en tres distintas posiciones del techo. Las fuerzas requeridas para “cortar” cada uno de los pernos en psi son los siguientes:

Posición 1 90 82 79 98 83 91Posición 2 105 89 93 104 89 95 86Posición 3 83 89 80 94

Efectúe el ANOVA para probar con un nivel de significancia de 0.05, si las diferencias entre las medias muestrales en las tres posiciones son significativas.

Las hipótesis planteadas son: H0: 1 = 2 = 3 vs H1: las i no son iguales.

Los datos ordenados para su análisis se presentan a continuación:

FUERZAS REQUERIDAS PARA CORTAR LOS PERNOS

RepeticionesTratamientos 1 2 3 4 5 6 7 Total PromedioPosición 1 90 82 79 98 83 91 523 87.2Posición 2 105 89 93 104 89 95 86 661 94.4Posición 3 83 89 80 94 346 86.5Total 278 260 252 296 172 186 86 1530

Los cálculos para la suma de cuadrados son los siguientes:

Factor de corrección = 15302 / 17 = 137700.

S. C. Totales = 138638 – 137700 = 938.

18

Page 61: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

S. C. Tratamientos = (5232 / 6) + (6612 / 7) + (3462 / 4) – FC. = 234.45.

S. C. Error experimental = 938 – 234.45 = 703.55.

El análisis de varianza se presenta en la siguiente tabla:

ANOVA DE LA RESISTENCIA A LA TENSIÓN DE PERNOS

Fuente de variación Suma de cuadrados

Grados de libertad

Cuadrado medio

F

Tratamientos 234.45 2 117.22 2.33Error experimental 703.55 14 50.25Total 938.00 16

Las probabilidad de tener una F = 2.33 para un = 0.05 con v1 = 2 y v2 = 14 grados de libertad, se presentan a continuación.

v1 = 2v2 = 0.10 = 0.05 = 0.0114 2.73 3.74 6.51

Puede apreciarse que la probabilidad de tener una F = 2.33 es mayor al 0.10, o lo que es lo mismo es mayor a 0.05, por lo tanto se acepta la hipótesis H0 y se concluye que la resistencia promedio de los pernos en las tres distintas posiciones, es la misma estadísticamente.Apéndice 4.1 Empleo del software Minitab en el análisis de un diseño completamente al azar.

Para ilustrar el empleo del software Minitab en la elaboración del ANOVA y el análisis residual, tomaremos el experimento para probar la resistencia de bolsas de papel para envasar comestibles. Los pasos a seguir pueden ser:

1. En la columna C1 de la hoja de cálculo rotule Tratamiento y en C2 Respuesta.

2. La manera como puede ser concentrada la variable de salida y los tratamientos en la hoja de cálculo es:

Tratamiento Respuesta1 A 72 A 83 A 154 A 115 A 96 A 10

19

Page 62: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ 4 B 12. . .. . .. . .24 D 20

3. Seleccione el menú Estadísticas.

4. Seleccione ANOVA.

5. Hacer clic en Un solo factor.

6. Cuando aparezca el cuadro de diálogo Análisis de varianza-Un solo factor: Ingresar C2 en el cuadro de Respuestas. Ingresar C1 en el cuadro Factor. Hacer clic en el cuadro Almacenar residuos. Hacer clic en Gráficas.

7. Cuando aparezca el cuadro de diálogo Análisis de varianza-Un solo factor- Gráficas: Hacer clic en el botón Gráficas individuales. Hacer clic en el cuadro Gráfica normal de residuos. Hacer clic en el cuadro Residuos contra ajustes. Hacer clic en Aceptar. Hacer clic en Aceptar.

En los cuadros de diálogo, Minitab tiene otras posibilidades más que usted puede aprovechar seleccionando las opciones que desee.

5. PRUEBAS DE COMPARACIÓN DE MEDIAS

5.1 Introducción.

Cuando se efectúa el análisis de varianza de un experimento, es con la finalidad de probar la hipótesis de igualdad de medias de los tratamientos (1 = 2, =… = t).

La prueba de análisis de varianza se basa en el cociente de dos varianzas, si el cociente es cercano a uno implica evidencia suficiente para inferir que las medias de los tratamientos son iguales. Cuanto más difiera de uno la evidencia indica que los promedios de los tratamientos no pertenecen a una población con una misma media , sin embargo esto no nos indica que parejas de medias pueden considerarse estadísticamente iguales.

En estadística existen diferentes metodologías para separar en grupos iguales (estadísticamente) los promedios de los tratamientos, al declarar significancia, o no, entre pares de medias de tratamientos.

20

Page 63: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ Las pruebas estudiadas en este tema son: Diferencia mínima significativa, prueba de rango múltiple Duncan, prueba de Student Neyman Keuls Test, prueba de Tukey, así como contrastes ortogonales.

5.2 Diferencia Mínima Significativa (D. M. S.).

Esta prueba no debe utilizarse a menos que la F del ANOVA sea significativa. Estrictamente hablando la DMS solo debe utilizarse para comparar medias adyacentes en un arreglo ordenado (medias dispuestas por orden de magnitud). Cuando esta prueba se usa de manera indiscriminada para probar todas las posibles diferencias entre diversas medias, ciertas diferencias serán significativas, pero no en el nivel de significancia que hemos escogido.

En vez de efectuarse el nivel del 5% las comparaciones entre medias con una separación mayor de dos en un arreglo ordenado, se realizará en un nivel de significación más bajo.

Para determinar la diferencia estadística entre medias de tratamientos, se calcula un valor llamado DMS. Si la diferencia de los promedios de tratamientos es mayor a este valor, entonces los tratamientos serán diferentes.

En el caso general de un diseño completamente al azar con t tratamientos y r repeticiones por tratamiento, la DMS se calcula por:

Donde: S2 = cuadrado medio del error del ANOVA. r = número de repeticiones. t = t de Student con los grados de libertad del error, un cierto nivel α

deseado, en una prueba bilateral.

Ejemplo: Los siguientes datos corresponden a la resistencia en libras por pulgada cuadrada de bolsas de papel en dos niveles de concentración de madera dura.

Repeticiones:Tratamiento 1 2 3 4 5 Total Promedio

21

Page 64: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

A = 5%

7 8 15 11 9 50 10.0

B =10% 12 17 13 18 19 79 15.8Total 19 25 28 29 28 129

Su análisis de varianza correspondiente es el siguiente.

Fuente devariación

Suma de cuadrados

Grados de libertad

Cuadrado medio

F

Tratamiento

84.1 1 84.10 8.53

Error experimental 78.8 8 9.85Total 162.9 9

Como la P (F = 8.53) < 5% se rechaza y se concluye que los tratamientos son diferentes.

Dado que se encontraron diferencias entre tratamientos, para aplicar la prueba DMS lo primero que tenemos de hacer es calcular el error estándar de la diferencia de medias de la siguiente manera:

= = 1.985

Calculemos ahora la DMS con un nivel de significancia del 5%, por lo que debemos obtener primero el valor de t de tablas con , que en nuestro caso es:

. Por lo tanto nuestra DMS será:

DMS : 1.985(2.306) = 4.577

Regla de decisión:

Sí | A - B | ≥ 4.577 se rechaza H0

En nuestro caso la diferencia de medias en valor absoluto es:

|10 – 15.8| = | 5.8 |, dado que 5.8 es 4.577 se rechaza H0, lo que nos indica que la media del tratamiento B es mayor estadísticamente a la media del tratamiento A. Esta prueba es totalmente válida cuando se tienen dos tratamientos.

22

Page 65: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ Cuando se tiene un experimento desbalanceado el cálculo del error estándar de la diferencia de medias se modifica a:

La prueba t cuando las repeticiones son iguales o diferentes es:

El utilizar la prueba t para comparar más de dos medias de tratamientos es muy riesgoso, ya que produce gran distorsión en el error tipo I. Por ejemplo, supongamos que se desea probar la igualdad de cinco medias usando comparaciones por pares, existen diez posibles comparaciones, y si la probabilidad de aceptar correctamente la hipótesis nula en cada prueba es 1 – α = 0.951, entonces la probabilidad de aceptar correctamente la hipótesis nula en los 10 pares es (0.95)10 = 0.60, si éstas son independientes. Es así como se produce un incremento sustancial del error tipo I.

5.3 Prueba de Rango Múltiple Duncan.

Esta prueba es una de las más utilizadas entre las diversas pruebas de rango múltiple disponibles. La prueba es similar a la DMS para medias adyacente de un arreglo ordenado, pero requiere valores progresivamente mayores para la significación entre medias, en la medida en que éstas se encuentran más ampliamente separadas en el arreglo. Para esta prueba no es necesario calcular el valor F y proceder solo si este es significativo, el investigador puede usarla independientemente de la significación de F. Los pasos para su aplicación son:

1. Obtención del error estándar de la media de tratamientos.

Donde: S2 = cuadrado medio del error del ANOVA.

r = número de repeticiones.

2. Obtener de la tabla de DUNCAN los rangos estudentizados significativos, t -1 valores que llamamos RESi i = 2,3,....,t, de acuerdo con un nivel α de significación requerido y con los grados de libertad del error.

3. Cada uno de los valores RESi se multiplican por obteniendo los rangos mínimos significativos RMSi = RESi .

23

Page 66: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

4. Se ordenan los promedios de los tratamientos en orden creciente y se comparan entre si.

5. Si las diferencias de los tratamientos son mayores que la RMS i , entonces se rechaza la hipótesis H0 : μi = μj

Ejemplo: Tomemos los valores del ANOVA sobre la resistencia de las bolsas de papel para envasar comestibles, donde se tienen r = 6 repeticiones, CME = 6.51, GLE = 20 y con promedios de los tratamientos de: , , y . La prueba se realizará con un nivel de significación α = 0.05.

1. Obtención del error estándar de la media de tratamientos.

2. Obtención del RESi, con 20 grados de libertad del error y un α = 0.05 de la tabla de Duncan.

2 3 42.95 3.10 3.18

3. Cálculo de los RMSi

2 3 43.07 3.23 3.31

4. Ordenamiento de los promedios de los tratamientos de menor a mayor.

A B C D10.0 15.67 17.0 21.17

5. Diferencias de medias y comparación contra su correspondiente RMS i

D - A = 21.17 – 10.00 = 11.17 vs 3.31 D - B = 21.17 – 15.67 = 5.50 vs 3.23 D - C = 21.17 – 17.00 = 4.17 vs 3.07

C - A = 17.0 – 10.00 = 7.00 vs 3.23 C - B = 17.0 – 15.67 = 1.33 vs 3.07 =

B - A = 15.67 – 10.00 = 5.67 vs 3.07

Los tratamientos son diferentes.

= Los tratamientos son iguales.

24

Page 67: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ Gráficamente los tratamientos que son iguales estadísticamente son:

A B C D _______ ________________ _______ c c b b a a

En función de la variable evaluada (resistencia de las bolsas), el ordenamiento de los mejores tratamientos en el reporte se hace del mejor al peor, en nuestro caso el mejor tratamiento es D con una resistencia promedio de 21.17 psi, por lo cual le asignamos la primera letra (a). No debe olvidarse que para un estudio más completo debe contemplarse el análisis económico de los tratamientos así como su análisis residual.

CLASIFICACIÓN DE TRATAMIENTOS SEGÚN PRUEBA DE DUNCAN.

Tratamientos Resistencia promedio en psi.

Significación estadística (1)

D = 20% 21.17 aC = 15% 17.00 bB = 10% 15.67 b A = 5% 10.00 c

(1) = Los tratamientos con la misma letra son estadísticamente iguales con una probabilidad del 95%.

De manera resumida, la prueba nos dice que el tratamiento D es superior estadísticamente a todos los demás, que le siguen C y B que pueden considerarse equivalentes, y que ambos son superiores al tratamiento A.

Finalmente solo nos queda decir que la bolsa que se recomienda para envasar comestibles, es la que tiene una concentración de 20% de madera dura que es el tratamiento D.

Para los casos donde se tengan dos o más tratamientos estadísticamente iguales como los mejores, se recomienda recurrir al análisis económico y recomendar el más barato, así como recurrir a las gráficas del análisis residual para recomendar aquel tratamiento que presente menor variabilidad dentro del grupo de los que son iguales.

Nota: Para el caso de un experimento desbalanceado, se sugiere que el valor r empleado para el cálculo de sea sustituido por:

Donde t = t de Student a un nivel α utilizado en la prueba con los grados de libertad del error.

25

Page 68: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

5.4 Prueba de Student Neyman Keuls Test.

Esta prueba es semejante a la de Duncan pero más estricta y al igual que ella ordena las medias en orden creciente, pero es menos estricta que la prueba de Tukey; su procedimiento es como sigue.

1. Primero se calcula el error estándar de la media.

Donde: cuadrado medio del error del ANOVA. r = número de repeticiones.

2. Se extraen t - 1 valores de la tabla de porcentaje máximo del rango estudentizado (tabla de Student Neyman), estos valores son:

Donde: α = nivel de significancia.

i = 2,....., t g = grados de libertad del error.

3. Obtención de los rangos mínimos significativos Wi

4. Se ordenan las medias de tratamiento de menor a mayor y se comparan entre ellas. Si la diferencia entre dos medias es mayor que el valor W i, entonces se rechaza la hipótesis H0: μi = μ j

Ejemplo. Considerando los resultados de un experimento donde la variable evaluada fue la resistencia de una fibra textil para la manufactura de camisas, compuestos por 5 porcentajes de algodón (tratamientos) y 5 repeticiones. El ANOVA dio una = 8.06 con 20 grados de libertad para el error; siendo los promedios de los tratamientos los siguientes:

y

1. Calculemos

2. Obtención de con un = 0.05, 5 tratamientos y 20 grados de libertad para el error, que lo indicamos por y lo obtenemos de la tabla de Student Newman.

26

Page 69: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

2 3 4 52.95 3.58 3.96 4.23

3. Cálculo de Wi

2 3 4 53.74 4.55 5.03 5.37

4. Ordenamiento de los promedios de tratamientos de menor a mayor.

9.8 10.8 15.4 17.6 21.6

5. Diferencias de medias y comparaciones contra su correspondiente W

30 - 15 = 21.6 - 9.8 = 11.8 vs 5.37 30 - 35 = 21.6 - 10.8 = 10.8 vs 5.03 30 - 20 = 21.6 - 15.4 = 6.2 vs 4.55 30 - 25 = 21.6 - 17.6 = 4.0 vs 3.74

25 - 15 = 17.6 - 9.8 = 7.8 vs 5.03 25 - 35 = 17.6 - 10.8 = 6.8 vs 4.55 25 - 20 = 17.6 - 15.4 = 2.2 vs 3. 74 =

20 - 15 = 15.4 - 9.8 = 5.6 vs 4.55 20 - 35 = 15.4 - 10.8 = 4.6 vs 3.74

35 - 15 = 10.8 - 9.8 = 1.0 vs 3.74 =

Los tratamientos son diferentes.= Los tratamientos son iguales.

Visto en una gráfica los tratamientos que son estadísticamente iguales para su formación de grupos es:

c c b b a a

En función de la variable evaluada, los mejores tratamientos se presentan a continuación.

27

Page 70: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

CLASIFICACIÓN DE TRATAMIENTO SEGÚN PRUEBA DE S. NEYMAN.

Porcentaje de algodón Resistencia promedio de la fibra

Significación estadística(1)

= 30% 21.6 a = 25% 17.6 b = 20% 15.4 b = 35% 10.8 c = 15% 9.8 c

(1) = los tratamientos con la misma letra son estadísticamente iguales al nivel indicado.

La prueba nos indica que el tratamiento que tiene el 30% de algodón es significativamente superior a todos los demás, le siguen los tratamientos con 20 y 25% que son equivalentes estadísticamente y al final se ubican los tratamientos con 35 y 15% de algodón que son iguales matemáticamente pero inferiores a todos los demás.

Por lo tanto el tratamiento recomendable en este caso es el que contiene el 30% de algodón.

5.5 Prueba de Tukey.

Esta prueba es también conocida como diferencia mínima significativa honesta (DMSH). Es similar a la prueba DMS, en el hecho de que se utiliza un solo valor para juzgar la diferencia entre las medias de los tratamientos.

El fundamento primordial de esta prueba es tratar de asegurar no cometer el error tipo I (pero no detecta diferencias que si pueden ser).

Esta prueba es más estricta que la de Duncan y la de Student Neyman en el sentido de que declara menos diferencias significativas. La prueba consiste en:

1. Cálculo del error estándar de la media.

2. Obtención del valor en la misma tabla para la prueba de Student Neyman, donde:

28

Page 71: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ Donde:

= nivel de significación.

t = número de tratamientos. g = grados de libertad del error.

3. Cálculo del valor =

4. Ordenamiento de los promedios de tratamientos y comparación entre ellos.

5. La diferencia entre dos medias se compara con el valor ; si esta diferencia es mayor que , indica que los tratamientos son diferentes.

Ejemplo. Considere el mismo experimento de la aplicación de diferentes porcentajes de algodón para la manufactura de camisas, donde se tienen 5 tratamientos, 5 repeticiones, 20 grados de libertad del error y 8.06 de cuadrado medio del error. Realice la prueba con un = 0.05

1. Cálculo de error estándar de la media.

2. Obtenga el valor q (0.05, 5, 20) = 4.23

3. El cálculo de = 4.23 (1.2696) = 5.37

4. Ordenamiento de los promedios de tratamientos.

9.8 10.8 15.4 17.6 21.6

5. Diferencias de medias y su comparación contra W

29

Page 72: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

Los tratamientos son diferentes.= Los tratamientos son iguales.

Ordenando y graficando los tratamiento en función de la variable evaluada, para determinar los grupos que son estadísticamente iguales tenemos.

a a b b c c d d

CLASIFICACIÓN DE TRATAMIENTO SEGÚN PRUEBA DE TUKEY

Porcentaje de algodón Resistencia promedio de la fibra

Significación estadística(1)

= 30% 21.6 a = 25% 17.6 a b = 20% 15.4 bc = 35% 10.8 cd = 15% 9.8 d

(1) = Los tratamientos con la misma letra son estadísticamente iguales el nivel indicado.

5.6 Contrastes ortogonales.

Los contrastes ortogonales deben ser planeados antes de llevar a cabo el experimento. Esto involucra la partición de los grados de libertad y la suma de cuadrados para los tratamientos en comparaciones componentes. Los cuales pueden consistir en comparaciones de clase o de tendencia.

Los tratamientos hábilmente son seleccionados para que puedan responder a tantas preguntas como grados de libertad existan en tratamientos. Esta prueba puede realizare aun cuando no exista diferencia significativa entre tratamientos.

Dentro de las principales ventajas que presentan son:

30

Page 73: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ 1. Permite responder preguntas específicas sobre los efectos del tratamiento.

2. Los cálculos son sencillos.

3. Suministra un útil control en la suma de cuadrados de tratamientos.

Como desventaja podemos citar que solo se puede aplicar en experimentos balanceados.

Lo que hacen los contrastes es: comparar un grupo de tratamientos que se parecen entre sí contra otro grupo de tratamientos que son semejantes, pero diferentes al primer grupo.

Un contraste es una combinación lineal de los totales de tratamientos, y se representa por:

Donde: Ci = coeficiente de los tratamientos Ti = total del tratamiento.

Donde la suma de los coeficientes de esa combinación lineal debe ser cero.

En un contraste siempre se tendrán signos positivos y negativos, y lo que se va a comparar son los contrastes con signo positivo contra los que tienen signo negativo.

Dos contrastes con coeficientes Ci y di son ortogonales si la suma de su producto da cero.

´Esto nos indica que los contrastes son independientes y sus efectos son separados.

La suma de cuadrados de cualquier contraste se calcula de la siguiente manera y tiene asociado un solo grado de libertad.

Dentro de las principales aplicaciones de los contrastes tenemos:

1. Comparación de medias. Algo acerca de la naturaleza de los tratamientos debe

31

Page 74: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

sugerir que comparaciones serán de interés.

2. Ajuste de polinomios ortogonales. Para factores cuantitativos cuyos niveles están igualmente espaciados, los contrastes se aplican para identificar tendencias en los tratamientos.

Ejemplo. La resistencia a la tensión de cierto sello de corcho, muestra la siguiente variación bajo cuatro condiciones de producción, A, B, C y D. Los resultados por unidad experimental aparecen en resistencia en libras por pulgada cuadrada.

RESISTENCIA A LA TENSIÓN DE UN SELLO DE CORCHO

Repeticiones:Tratamiento

1 2 3 4 Total Promedio

A 3.8 4.1 4.0 3.8 15.7 3.92B 4.2 4.2 4.4 4.3 17.1 4.27C 3.8 3.9 3.7 3.8 15.2 3.80D 3.5 3.7 3.6 3.7 14.5 3.63Total 15.3 15.9 15.7 15.6 62.5

El análisis de varianza general para este experimento se presenta en la tabla siguiente:

ANOVA DE LA RESISTENCIA A LA TENSIÓN DE UN SELLO DE CORCHO

Fuente de variación

Suma de cuadrados

Grados de libertad

Cuadrado medio

F

Tratamiento 0.906875 3 0.302292 25.46Error 0.1425 12 0.011875Total 1.049375 15

Dado que los grados de libertad para tratamiento en el ANOVA son tres, por lo tanto los contrastes que podemos formar también son tres.

Para realizar las comparaciones se recomienda ordenar los totales de los tratamientos de menor a mayor, para poder hacer los grupos de tratamientos que serán comparados.

D C A B 14.5 15.2 15.7 17.1

32

Page 75: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ Puede observarse que el grupo de tratamientos D, C y A se parecen entre sí, pero son diferentes al grupo B; así mismo dentro del primer grupo el tratamiento D casi no se parece al grupo C y A; el último grupo a comparar será el C vs A. Por lo tanto los contrastes a realizar son: DCA vs B, D vs CA y C vs A.

La tabla de coeficientes (Ci) para las comparaciones, la realizamos mediante la elaboración de los contrastes, de la manera siguiente:

Primer contraste. (D, C, A) vs (B)

¿Cuántos tratamientos tienen el primer grupo? Tres.

¿Cuántos tratamientos tiene el segundo grupo? Uno.

¿Este valor (3) se puede simplificar igual que el del otro grupo (1)? No. Ahora el coeficiente de un grupo pasa a ser coeficiente del otro grupo y viceversa, concentrándose en una tabla como se muestra más adelante.

A los coeficientes de cualquier grupo se les pone signo negativo, de tal manera que

se cumpla

Segundo contraste. (D) vs (C, A)

Nos hacemos las mismas preguntas que se hicieron en el primer contraste y obtenemos sus coeficientes que son: 1 y 2. Así mismo se cambian los coeficientes por grupo y se le asigna signo negativo a uno de ellos.

Dado que solo participan los tratamientos D, C y A, al tratamiento B se le pone cero en la tabla de coeficientes.

Tercer contraste. (C) vs (A)

C vs A

1 1

TABLA DE COEFICIENTES Ci

Totales por tratamientoComparaciones D

14.5C

15.2A

15.7B

17.1(D, C, A) vs B -1 -1 -1 3D vs (C, A) -2 1 1 0

33

Page 76: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ C vs A 0 -1 1 0

Ya realizada la tabla, verificamos si son ortogonales los contrastes, esto es verificar

si se cumple

Primer contraste vs segundo contraste.

(D, C, A) vs (B) y (D vs C, A)

(-1) (-2) + (-1) (1) + (-1) (1) + (3) (0) = 0

Esto nos indica que los contrastes son independientes y sus efectos son separados.

Primer contraste vs tercer contraste.

(D, C, A) vs (B) y (C vs A)

(-1) (0) + (-1) (-1) + (-1) (1) + (3) (0) = 0

Segundo contraste vs tercer contraste.

(D vs C, A) y (C vs A)

(-2) (0) + (1) (-1) + (1) (1) + (0) (0) = 0

Aquí se planearon tres contrastes que coinciden con los grados de libertad de los tratamientos.

La suma de cuadrados para los contrastes se obtiene de la siguiente forma:

Suma de cuadrados para el primer contraste.

= (-1)(14.5)+(-1)(15.2)+(-1)(15.7)+(3)(17.1) = 5.9

34

Page 77: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

= (-1) + (-1) + (-1) + (3) = 12

SC (C1) = (5.9) / 4(12) = 0.725208333

Segundo contraste:

= (-2)(14.5)+(1)(15.2)+(1)(15.7)+(0)(17.1) = 1.9

= (-2) 2 + (1) 2 + (1)2 = 6

SC (C2)= (1.9) / 4(6) = 0.150416666

Tercer contraste:

= (0)(14.5)+(-1)(15.2)+(1)(15.7)+(0)(17.1) = 0.5

= (-1)2 + (1)2 = 2

SC (C3)= 0.5 / 4(2)= 0.03125

Puede observarse que la suma de cuadrados de los contrastes es idéntica a la suma de cuadrados de tratamientos obtenida en el ANOVA anterior, esto nos garantiza que los cuadrados de los contrastes fueron bien calculados. El nuevo análisis de varianza incluyendo contrastes se presenta en la siguiente tabla.

ANOVA DE LA RESISTENCIA A LA TENSIÓN DE UN SELLO DE CORCHO

Fuente de variación

Suma de cuadrados

Grados de libertad

Cuadrado medio

F

Tratamientos 0.906874999

3

(D, C, A) vs (B) 0.725208333

1 0.725208333 61.1

D vs (C, A) 0.150416666

1 0.150416666 12.7

C vs A 0.03125 1 0.03125 2.6Error 0.1425 12 0.011875Total 1.049375 15

35

Page 78: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

Como P (F = 61.1) es menor a 0.01 (menor a 5%) se rechaza la hipótesis H0 y se acepta la hipótesis alterna, con lo que se concluye que en base a la evidencia experimental los grupos de tratamientos son diferentes.

Como P (F = 12.7) es menor a 0.01 (menor a 5%) se rechaza la hipótesis H 0 y se acepta la hipótesis H1, concluyendo que los grupos de tratamientos son diferentes.

Como P (F = 2.6) es mayor a 0.10 (mayor a 5%), se acepta la hipótesis H0 y se concluye que los grupos de tratamientos son estadísticamente iguales.

Gráficamente los tratamientos con sus correspondientes promedios que estadísticamente son iguales se muestran a continuación:

D C A B3.63 3.80 3.92 4.27

a a b b c c Dado que la variable analizada es la resistencia a la tensión de cierto sello de corcho, por lo tanto el ordenamiento del mejor tratamiento se empieza con el tratamiento B, como se muestra a continuación:

CLASIFICACIÓN DE TRATAMIENTOS SEGÚN CONTRASTES ORTOGONALES

Tratamiento Resistencia promedio a la tensión en psi.

Significación estadística (1)

B 4.27 aA 3.92 bC 3.80 b D 3.63 c

(1) = Los tratamientos con la misma letra son estadísticamente iguales.

En resumen el experimento nos indica que el tratamiento B es estadísticamente superior a todos los demás, le siguen el A y C que son equivalentes, pero superiores al tratamiento D que quedo en ultimo lugar, por lo que el tratamiento a recomendar es el B.

A manera de resumen de las pruebas de rango y contrastes ortogonales se presenta el siguiente esquema, el cual indica la mejor prueba que deberá realizarse según los tipos de factores a investigar.

36

Page 79: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

RESUMEN DE PRUEBAS A REALIZAR SEGÚN LOS TIPOS DE FACTORES

EXPERIMENTO

FACTORES FACTORES CUALITATIVOS CUANTITATIVOS

NIVELES CON NIVELES SIN IGUALMENTE NOESTRUCTURA ESTRUCTURA ESPACIADOS O EQUIDIS- EQUIDISTANTES TANTES

CONTRASTES PRUEBA DE CONTRASTES REGRESIÓNORTOGONALES RANGO ORTOGONALES MÚLTIPLE

37

Page 80: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

6. DISEÑO DE BLOQUES AL AZAR

6.1 Introducción.

Es uno de los diseños más utilizados. Mejora la precisión de comparaciones entre tratamientos, al eliminar la variabilidad entre unidades experimentales en diferentes bloques.

Un bloque es un conjunto de unidades experimentales homogéneas para probar los tratamientos. La homogeneidad debe ser relativa a características de las unidades experimentales que influyen fuertemente sobre la variable de respuesta.

La variación entre bloques debe ser grande para que el diseño sea realmente eficiente en comparación con el diseño completamente aleatorio. Si no hay variación entre bloques el diseño completamente al azar es el más apropiado.

El mecanismo de distribución de los tratamientos debe ser completamente al azar y de manera independiente dentro de cada bloque. El bloque funciona como una variable de control, no se pueden probar hipótesis en los bloques ya que no existen repeticiones en los bloques.

En todo caso su interpretación puede ser: si la F de bloques es mayor que uno, indica que se ganó eficiencia contra el diseño completamente aleatorio, y si es menor que uno quiere decir que no se ganó mucha eficiencia.

Dentro de esta unidad se contemplan los subtemas siguientes: Ventajas de este diseño, análisis estadístico, validación del modelo y estimación de datos perdidos.

6.2 Ventajas del diseño de bloques al azar.

1. Se obtienen resultados más exactos que cuando se utiliza el diseño completamente aleatorio.

2. Pueden incluirse cualquier número de repeticiones y tratamientos. Si se desean repeticiones adicionales para algunos tratamientos, cada uno de estos puede aplicarse a dos unidades dentro de cada bloque.

3. El análisis estadístico es fácil. Cuando se pierden algunas unidades experimentales, éstas se pueden calcular por la técnica de “parcelas perdidas” desarrollada por Yates.4. Ningún otro diseño es utilizado tan frecuentemente en las áreas de investigación como el de bloques al azar.

6.3 Ejemplos de la instalación de experimentos en bloques al azar.

Ejemplo 1. Se van a comparar seis variedades de avena (A, B, C, D, E, F) con respecto a su rendimiento, disponiéndose de 30 parcelas experimentales y se observa evidencia que existe tendencia

1

Page 81: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ en la fertilidad de norte a sur. De acuerdo con esto parece razonable agrupar a las parcelas en cinco grupos de seis parcelas por bloque.

Así en el primer bloque estarán las seis parcelas más fértiles y en el último bloque las seis parcelas menos fértiles. Una vez hecho esto, las seis variedades se asignan de manera aleatoria en el primer bloque, posteriormente se aleatorizan en el segundo bloque y así sucesivamente en los demás bloques.

Ejemplo 2. Se van a probar 10 raciones de alimento para la engorda de ganado, para la investigación se dispone de 40 toros de la misma raza pero con diversos pesos, aquí es recomendable hacer 40 /10 = 4 grupos o bloques de 10 animales cada uno tomando en cuenta su peso. Así los toretes más pesados se agruparán en un bloque, los menos pesados en otro y así sucesivamente.

Los 10 tratamientos (raciones) se asignan de manera aleatoria en el primer bloque, posteriormente en el segundo y así sucesivamente.

Ejemplo 3. Se desea determinar si cuatro diferentes puntas (tratamientos) producen una diferencia en las lecturas de un equipo para medir la dureza. La máquina funciona presionando la punta sobre una lámina de metal y determinando la dureza de la punta a partir de la profundidad de la marca que se produce. Sabemos que las láminas son ligeramente diferentes en cuanto a dureza ya que provienen de diferentes vaciados.

Para la prueba se dispone de cuatro láminas, por lo que una lámina será considerada como un bloque y en cada una de ellas el investigador debe probar cada una de las cuatro puntas de manera aleatoria, con lo que tendrá 16 unidades experimentales.

Puede observarse en cada ejemplo que la variabilidad dentro de cada bloque es chica, mientras que la variabilidad entre bloques es grande, o sea que un bloque nos sirve como una unidad de control.

6.4 Análisis estadístico.

Suponga que se tiene t tratamientos (que deben ser comparados) y b bloques, donde se realiza una observación por tratamiento en cada bloque y el orden en que los tratamientos son medidos en cada bloque se determina aleatoriamente. El modelo estadístico para este diseño es:

i = 1, 2,..., t tratamientos y j = 1, 2,..., b bloques

Donde μ es una media general, ζi es el efecto del i-ésimo tratamiento, βj es el efecto de j-ésimo

bloque y εij es el término usual N(0; σ 2) de error aleatorio. Por lo que un diseño de bloques al azar lo podemos representar por:

Bloques:Tratamientos 1 2 b Total Promedio

1 . . .2 . . .3 . . .. . . . . .. . . . . .. . . . . .t . . .

2

Page 82: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

Total . . .

Las sumas de cuadrados para las fuentes de variación son:

Factor de corrección = FC =

S. C. Totales =

S. C. Tratamientos =

S. C. Bloques =

S. C. Error = S. C. Totales – S. C. Tratamientos – S. C. Bloques.

Estas sumas de cuadrados se concentran en la siguiente tabla para su análisis de varianza (ANOVA).

Fuente de Suma de Grados de Cuadrado Fvariación cuadrados libertad medio

Tratamientos t - 1

Bloques b-1

Error Exptal. (b -1) (t -1)

Total b t - 1

3

Page 83: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

Si la probabilidad de tener una F igual a la del ANOVA es menor a 5% se rechaza la hipótesis H0: los tratamientos son iguales y se acepta la hipótesis H1: al menos un tratamiento es diferente.

Ejemplo. Se efectuó un experimento para determinar el efecto de cuatro diferentes compuestos químicos en la resistencia de una fibra. Estos compuestos se emplearon como parte del proceso de acabado de planchado permanente. Se seleccionaron cinco muestras de fibra de diferentes lotes de producción (bloques), y en cada muestra se probaron los cuatro compuestos químicos en forma aleatoria, los resultados se presentan en libras por pulgada cuadrada (psi) en la siguiente tabla.

Bloques Tratamientos1 B 2.2 D 3.9 C 1.8 A 1.32 C 1.7 A 1.6 D 4.4 B 2.43 D 2.0 A 0.5 B 0.4 C 0.64 D 4.1 C 1.5 B 2.0 A 1.25 B 1.8 A 1.1 C 1.3 D 3.4

Lo primero que tenemos que hacer es organizar los datos como lo muestra el siguiente cuadro.

RESISTENCIA DE LA FIBRA DE CUATRO COMPUESTOS QUÍMICOS

Tratamientos1 2

Bloques:3 4 5

Total

A 1.3 1.6 0.5 1.2 1.1 5.7 1.14B 2.2 2.4 0.4 2.0 1.8 8.8 1.76C 1.8 1.7 0.6 1.5 1.3 6.9 1.38D 3.9 4.4 2.0 4.1 3.4 17.8 3.56Total 9.2 10.1 3.5 8.8 7.6 39.2

2.3 2.53 0.88 2.2 1.9 1.96

Las sumas de cuadrados para el análisis de varianza (ANOVA) se obtienen de la siguiente manera:

Factor de corrección = = 39.22 / 5(4) = 76.83

S. C. Totales =

S. C. Tratamientos =

S. C. Bloques =

4

Page 84: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

S. C. Error = S. C. Totales – S. C. Tratamientos – S. C. Bloques = 25.69 – 18.04 – 6.69 = 0.96

La tabla del análisis de varianza se presenta a continuación.

ANOVA DE LA RESISTENCIA DE LA FIBRA

Fuente devariación

Suma de cuadrados

Grados de libertad Cuadrado medio F

Tratamientos 18.04 3 6.01 75.13Bloques 6.69 4 1.67 20.87Error Exptal. 0.96 12 0.08Total 25.69 19

Para decidir si existe diferencia significativa entre los compuestos químicos, se obtiene la probabilidad de tener una F = 75.13 de la tabla F de Fisher. Si la probabilidad de tener una F igual a la de la muestra es menor al 5% se rechaza la hipótesis H0: los tratamientos son iguales y se acepta la hipótesis alterna H1: al menos un tratamiento es diferente.

La manera como se busca la probabilidad en la tabla F es: localizar en la parte superior de la tabla los grados de libertad para el numerador de la razón F que se tienen en el ANOVA, en nuestro caso v1 = 3; posteriormente se busca en la parte izquierda de la tabla los grados de libertad del denominador, en nuestro ejemplo v2 = 12. Donde se intercepten v1 y v2 se localiza el valor de F esperada en el análisis a cierto nivel de . En nuestro caso son:

v1 = 3v2 = 0.10 = 0.05 = 0.0112 2.61 3.49 5.95

Se puede ver que el valor de F = 75.13 se encuentra a la derecha de 5.95 por lo que le corresponde una probabilidad menor a 0.01. Puesto que la probabilidad de que se hubiese obtenido por mero azar una F = 75.13 es menor al 5%, rechazamos la hipótesis nula (H0: 1 = 2 =. . . = µy se acepta la hipótesis alterna (H1: i ≠ j para alguna i , j) , con lo que se puede concluir que existe diferencia altamente significativa en cuanto a resistencia en psi se refiere de los compuestos químicos, o sea los tratamientos son diferentes. En el ANOVA se observa que la F calculada para bloques fue mayor que uno, en nuestro caso es de 20.87. Esto nos indica que al haber utilizado el diseño de bloques al azar para probar el efecto de los tratamientos, se logró ganar eficiencia ante el diseño completamente al azar, es decir, que se realizó un buen bloqueo.

El error experimental lo construyen la interacción entre bloques y tratamientos. Por lo que no debe existir interacción entre estas dos fuentes de variación. O lo que es lo mismo, si el tratamiento A es bueno en el bloque uno, así debe ser en los demás bloques. Si se presenta interacción, los datos deben ser analizados bajo otra métrica (transformarlos).

Los resultados de la prueba Duncan se muestran a continuación, así como la agrupación de los promedios de tratamientos.

A C B D

5

Page 85: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

0 1 2 3 4 b b a a c c

La clasificación de los mejores tratamientos se presenta en la tabla siguiente.

CLASIFICACIÓN DE TRATAMIENTOS SEGÚN PRUEBA DE DUNCAN

Compuestos químicos Resistencia promedio de la fibra en psi.

Significación estadística

D 3.45 aB 1.76 bC 1.38 bcA 1.14 c

La prueba nos indica que el tratamiento D es superior estadísticamente a todos los demás, le siguen B y C que pueden considerarse equivalentes, pero C es semejante matemáticamente a A.

Para este caso el compuesto químico a recomendar es el tratamiento D, por lograr dar mayor resistencia a la fibra.

6.5 Análisis residual y verificación del modelo. Los supuestos en que se basa el análisis de varianza para dar al modelo como válido son:

a) Las varianzas de los tratamientos son iguales.b) Las varianzas de los bloques son iguales.c) No existe interacción entre bloques y tratamientos.d) Los errores (residuos) son aleatorios con media igual a cero.e) La variable de salida se distribuye normalmente.

Con el fin de verificar los supuestos del ANOVA antes citados, iniciaremos por calcular los residuos así como los valores ajustados, con el fin de poder realizar las gráficas correspondientes.

Los residuos para el diseño de bloques al azar son justo la diferencia entre los valores observados ( ) y los ajustados ( ), y se define por:

Mientras que los valores ajustados son:

Así el residuo e11 que corresponde al tratamiento A del primer bloque, en el ejemplo de la comparación de los cuatro compuestos químicos es:

Donde

Por lo tanto

6

Page 86: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ El valor ajustado ( ) representa la estimación de la respuesta media cuando se ejecuta el tratamiento i-ésimo en el bloque j-ésimo. Los demás residuos se obtendrán de manera análoga, los cuales aparecen en la siguiente tabla.

RESIDUOS PARA LA RESISTENCIA DE LA FIBRA

Compuesto Bloques:químico 1 2 3 4 5

A -0.18 -0.11 0.44 -0.18 0.02B 0.10 0.07 -0.27 0.00 0.10C 0.08 -0.24 0.30 -0.12 -0.02D 0.00 0.27 -0.48 0.30 -0.10

Si graficamos los residuos contra los tratamientos y bloques podemos apreciar que:

En la primera gráfica de residuos contra tratamientos, el tipo de compuesto D que proporciona la resistencia más grande, presenta variabilidad un poco mayor en cuanto a resistencia.

Así mismo en esta gráfica se puede apreciar que no existe un patrón definido en los residuos, por lo que podemos decir que el supuesto de igualdad de varianzas en los tratamientos se cumple. En igual forma se puede apreciar que los residuos son aleatorios y con promedio de cero.

En la segunda gráfica de residuos contra bloques se observa que en la muestra de fibra (bloque 3) existe mayor variabilidad en la resistencia cuando se trata con los cuatro componentes químicos que las otras muestras. Así mismo se puede apreciar que no existe un patrón definido en esta gráfica, lo anterior nos indica que el supuesto de igualdad de varianzas en los bloques se cumple, por lo tanto los resultados obtenidos por el ANOVA son válidos.

Cuando aparece un patrón en alguna de las gráficas, por lo general suele indicar la necesidad de una transformación de los datos originales, esto es, analizar la variable de salida en una métrica diferente.

GRÁFICA DE RESIDUOS CONTRA TRATAMIENTOS0.5

0.3

-0.1 0

0.1

-0.5

-0.3

A B C D

7

Page 87: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

GRÁFICA DE RESIDUOS CONTRA BLOQUES

Es recomendable realizar una gráfica de residuos contra (valores ajustados) para probar la interacción de tratamientos y bloques. Si la gráfica resultante presenta la forma de curva, esto nos sugiere que existe interacción, si esto sucede, debe usarse alguna transformación de los datos originales. y volver a realizar el ANOVA y las pruebas de rango, pero ahora con los nuevos valores.

El cuadro siguiente muestra los valores ajustados para cada uno de los tratamientos en los diferentes bloques.

VALORES AJUSTADOS PARA LA RESISTENCIA DE LA FIBRA

Compuestoquímico 1 2

Bloques:3 4 5

A 1.48 1.71 0.06 1.38 1.08B 2.10 2.33 0.68 2.00 1.70C 1.72 1.95 0.30 1.62 1.32D 3.90 4.13 2.48 3.80 3.50

8

Page 88: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

Si relacionamos los valores de los residuos obtenidos con anterioridad en el eje y con los valores ajustados del cuadro anterior en el eje x, obtenemos la siguiente gráfica:

GRÁFICA DE CONTRA

Como los residuos no presentan la forma de curva, podemos concluir que no existe interacción entre bloques y tratamientos.

La gráfica que nos dice si la variable de salida se distribuye de manera normal, es la de probabilidad normal de los residuales, que se presenta a continuación.

GRÁFICA DE PROBABILIDAD NORMAL DE LOS RESIDUOS

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5

Valores ajustados para la resistencia de la fibra

ij

9

Page 89: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

Puede observarse que no hay anormalidad en la gráfica, por lo tanto el supuesto de normalidad de la variable de salida ( ) se cumple.

Otro indicador práctico que nos dice si la variable de salida se distribuyen de manera normal es el coeficiente de variación, que se simboliza por:

Donde CME es el cuadrado medio del error del análisis de varianza de los datos.

Un criterio práctico que indica normalidad en los datos, es cuando el coeficiente de variación toma los siguientes valores:

0 a 10% muy confiable la normalidad. 10 a 20% confiable la normalidad. 20 a 30% poco confiable la normalidad. Más de 30% no confiable la normalidad.

En nuestro ejemplo el coeficiente de variación es de 14.4%, lo que nos indica que la normalidad es confiable.

Dado que no se presentaron anomalías al realizar el análisis residual, concluimos de manera general, que en base a la evidencia experimental nuestro modelo utilizado para analizar la información es válido.

6.6 Datos faltantes en un diseño de bloques al azar.

Muchas veces después de haber realizado un gran esfuerzo en la planeación y la conducción del experimento, nos encontramos con el problema de que se pierden parcelas experimentales. Esto es muy común debido a:

Un animal muere por causas ajenas al tratamiento, una parcela en el campo se inunda, nos destruyen la información de una unidad experimental, un tubo de ensayo se quiebra en el laboratorio, un roedor

10

Page 90: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ nos destruye una unidad experimental en la fábrica, etc. Donde todos estos acontecimientos son ajenos a los efectos de los tratamientos.

Esto comúnmente ocasiona un desbalanceo en el experimento. Si estamos en un diseño completamente al azar no hay problema ya que se trabaja como experimento desbalanceado, pero en un diseño bloques al azar, un dato faltante destruye usualmente el balance, ya que todos los tratamientos deben estar en cada bloque.

¿Qué hacer cuando se desbalancea un experimento?

1. Falta un bloque completo. Cuando falta uno o más bloques, el análisis se procede de forma normal, siempre y cuando tengamos por lo menos dos bloques.

2. Falta totalmente un tratamiento. Nuevamente el análisis se procede normalmente, siempre y cuando nos hayan quedado por lo menos dos tratamientos.

3. La situación que ocurre comúnmente es la falta de una unidad experimental. En este caso, existe un método desarrollado por Yates para estimar un dato perdido mediante el algoritmo matemático siguiente:

Donde:t = número de tratamientos.b = número de bloques.T = total del tratamiento correspondiente al dato perdido.B = total del bloque correspondiente al dato perdido.G = suma de todas las observaciones reales.

Para mayor precisión en la prueba de F, a la suma de cuadrado de tratamientos se le sustrae la cantidad.

Donde: B = total no corregido del bloque donde se presentó la observación faltante. El valor estimado ( ) se reemplaza en el lugar correspondiente y el ANOVA se realiza en la forma usual, excepto que se sustrae un grado de libertad en el error y el total. Tomemos el ejemplo de los datos de diferentes compuestos químicos en la resistencia de una fibra, suponiendo que se perdió el tratamiento A del bloque cuatro.

Bloques:Tratamientos 1 2 3 4 5 Total

A 1.3 1.6 0.5 1.1 4.5B 2.2 2.4 0.4 2.0 1.8 8.8C 1.8 1.7 0.6 1.5 1.3 6.9D 3.9 4.4 2.0 4.1 3.4 17.8

11

Page 91: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

Total 9.2 10.1 3.5 7.6 7.6 38.0

Para estimar el dato perdido tenemos:

La corrección para la suma de cuadrados de tratamientos será:

El valor obtenido de la parcela perdida de 1.5, es substituido en la tabla correspondiente del dato faltante y se realiza el análisis de varianza de la manera acostumbrada, teniendo cuidado de restarle a la suma de cuadrados de tratamientos la corrección, que en nuestro caso es 0.80, así como restar un grado de libertad en el error y el total.

Bloques:Tratamientos 1 2 3 4 5 Total

A 1.3 1.6 0.5 1.5 1.1 6.0B 2.2 2.4 0.4 2.0 1.8 8.8C 1.8 1.7 0.6 1.5 1.3 6.9D 3.9 4.4 2.0 4.1 3.4 17.8

Total 9.2 10.1 3.5 9.1 7.6 39.5

Las sumas de cuadrados y grados de libertad se presentan a continuación.

S. C. Tratamientos = 17.566 S. C. Tratamientos corregida = 17.566 – 0.8 = 16.766, con 3 g. l.S. C. Bloques = 6.86 con 4 g. l.

S. C. Error = 25.32 – 17.56 – 6.86 = 0.90 con 11 g. l.S. C. Total = 25.32 con 18 g. l.

Observe que a la suma de cuadrados del error se le restó la suma de cuadrados de tratamientos sin corregir. El ANOVA correspondiente queda definido por:

ANOVA DE LA RESISTENCIA DE LA FIBRA

Fuente devariación

Suma de cuadrados

Grados de libertad Cuadrado medio F

Tratamientos 16.77 3 5.590 68.17Bloques 6.86 4 1.715 20.92Error Exptal. 0.90 11 0.082Total 25.32 18

6.6.1 Cuando se tiene varios datos perdidos.

12

Page 92: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ Cuando en el experimento se presentan varios datos perdidos en diferentes bloques, el procedimiento para estimarlos se presenta a continuación:

1. Se estiman todos los datos perdidos excepto uno de ellos. Una aproximación razonable para ellos se puede obtener calculando .

2. El dato restante se estima siguiendo el procedimiento de cuando existe solo un dato perdido.

3. Con esta aproximación y los valores previamente asignados, se escoge otro de los datos y nuevamente se aproxima por la técnica cuando existe solo un dato perdido, y así sucesivamente.

4. Después de completar un ciclo, una segunda aproximación se realiza para todos los valores en el orden dado previamente. Esto se continúa hasta que no existen diferencias esenciales a la aproximación encontrada en el ciclo previo. Usualmente dos ciclos son suficientes.

5. Los valores estimados se introducen en la tabla junto con los valores observados y el ANOVA se efectúa. Por cada dato perdido se sustrae un grado de libertad tanto al total como en el error.

6. Para mayor precisión en la prueba F, a la S. C. de tratamientos se le sustrae la cantidad:

Donde:

B´ = total sin corregir de todas las observaciones en el mismo bloque en que se presentó la 1a observación faltante.

B´´ = total sin corregir de todas las observaciones en el mismo bloque en que se presentó la 2a observación faltante.

Ejemplo. Considere el siguiente experimento donde la variable evaluada fue el rendimiento, y en el experimento se perdieron dos unidades experimentales (tratamientos B bloque 1 y tratamientos D bloque 3).

RENDIMIENTO...

Bloques:Tratamientos 1 2 3 4 Total

A 4.4 5.9 6.0 4.1 20.4B 1.9 4.9 7.1 13.9

C 4.4 4.0 4.5 3.1 16.0D 6.8 6.6 6.4 19.8

E 6.3 4.9 5.9 7.1 24.2F 6.4 6.3 7.7 7.7 28.1

Total 28.3 29.6 29.0 35.5 122.4

Los cálculos para la obtención de las parcelas perdidas son:

1. Iniciemos por calcular la primera parcela perdida yb.

13

Page 93: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

2. Estimación de ya en el primer ciclo como si se tuviera una sola parcela perdida.

3. Estimación de yb en el primer ciclo.

4. Estimación de ya en el segundo ciclo.

5. Estimación de yb en el segundo ciclo.

Si únicamente tenemos dos observaciones faltantes (no en el mismo bloque) la corrección necesaria para los sesgos en la suma de cuadrados de tratamientos es:

Donde sustituyendo valores en las incógnitas correspondientes tenemos.

Los valores estimados de y se concentra en la tabla correspondiente y se procede a la realización del ANOVA.

Bloques:Tratamientos 1 2 3 4 Total

A 4.4 5.9 6.0 4.1 20.4B 4.47 1.9 4.9 7.1 18.37C 4.4 4.0 4.5 3.1 16.0D 6.8 6.6 7.2 6.4 27.0E 6.3 4.9 5.9 7.1 24.2F 6.4 6.3 7.7 7.7 28.1

14

Page 94: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________

Total 32.77 29.6 36.2 35.5 134.07

Las sumas de cuadrados para las fuentes de variación son:

S. C. Tratamientos = 29.46 S. C. Tratamientos corregida = 29.46 – 2.81 = 26.65S. C. Bloques = 4.50

S. C. Total = 51.95S. C. Error = 51.95 – 29.46 – 4.50 = 17.99

Los grados de libertad para las fuentes de variación son:

Fuente de variación Grados de libertadNormal corregido

Tratamientos 5 5Bloques 3 3Error experimental 15 13Total 23 21

El análisis de varianza correspondiente para el experimento donde se perdieron dos datos se presenta a continuación:

Fuente devariación

Suma de cuadrados

Grados de libertad Cuadrado medio F

Tratamientos 26.65 5 5.33 3.86Bloques 4.50 3 1.50 1.09Error Exptal. 17.99 13 1.38Total 51.95 21

Si faltan más de dos observaciones, o si faltan dos observaciones en el mismo bloque, debe hacerse corrección por sesgos o tendencias en la suma de cuadrados de tratamientos.

Apéndice 6.1 Empleo del software Minitab en un diseño bloques al azar.

Para ilustrar el empleo del software Minitab en la elaboración del ANOVA y el análisis residual, tomaremos el experimento para determinar el efecto de cuatro diferentes compuestos químicos en la resistencia de una fibra. Los pasos a seguir pueden ser:

1. En la columna C1 de la hoja de cálculo rotule Tratamientos, en C2 Bloques y en C3 Respuesta.

2. Para concentrar los tratamientos (A, B, C, D) serán utilizados números en lugar de letras. La manera como son concentrados los tratamientos, los bloques y la variable de salida en la hoja de cálculo, puede ser:

Tratamientos Bloques Respuesta1 1 1 1.32 1 2 1.63 1 3 0.54 1 4 1.25 1 5 1.16 2 1 2.2. . . .. . . .. . . .

15

Page 95: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Diseño completamente al azar y pruebas de rango múltiple ___________________________________________________________________________________________ . . . .20 4 5 1.9

3. Seleccione el menú Estadísticas.

4. Seleccione ANOVA.

5. Hacer clic en Dos factores.

6. Cuando aparezca el cuadro de diálogo Análisis de varianza de dos factores: Ingresar C3 en el cuadro de Respuestas. Ingresar C1 en el cuadro Factor de fila. Ingresar C2 en el cuadro Factor de la columna. Hacer clic en el cuadro Almacenar residuos. Hacer clic en el cuadro Almacenar ajustes. Hacer clic en Gráficas.

7. Cuando aparezca el cuadro de diálogo Análisis de varianza-de dos factores- Gráficas: Hacer clic en el botón Gráficas individuales. Hacer clic en el cuadro Gráfica normal de residuos. Hacer clic en el cuadro Residuos vs ajustes. Hacer clic en el cuadro Residuos vs las variables. Ingresar C2 en el cuadro Residuos vs las variables. Hacer clic en Aceptar. Hacer clic en Aceptar.

En los cuadros de diálogo, MINITAB tiene otras posibilidades más que usted puede aprovechar seleccionando las opciones que desee.

16

Page 96: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

7. ARREGLOS FACTORIALES

7.1 Introducción.

Hasta ahora hemos estudiado experimentos simples, en los que solo se compara un factor en diversos aspectos, es decir donde solo existe una causa pertinente de variación. Ahora veremos la comparación de varios factores, con diferentes niveles en cada uno.

Se entiende por arreglo factorial, cuando se investigan todas las posibles combinaciones de los niveles de los factores en cada ensayo completo o réplica del experimento.

Los factores pueden ser cualitativos o cuantitativos, los primeros son aquellos que no pueden ser arreglados en orden de magnitud, mientras que los segundos están asociados con puntos en una escala numérica.

Los factores generalmente se denotan con letras mayúsculas y los niveles con letras minúsculas o números; si hay a niveles del factor A y b niveles del factor B, entonces cada replica del experimento contiene todas las ab combinaciones de los tratamientos.

Por ejemplo, se comparan los factores A y B, donde el factor A esta compuesto por los niveles , β, , , y el factor B por los niveles 1, 2, 3. Por lo tanto el total de tratamientos que se tendrán son 4 x 3 = 12, como se muestra a continuación.

B1 2 3

1 2 3A β β 1 β 2 β 3

1 2 3 1 2 3

Ahora estos 12 tratamientos pueden instalarse bajo las normas de cualquier diseño experimental con n repeticiones.

“Una característica importante de los arreglos factoriales es que la asignación de los niveles de cada uno de los factores a las unidades experimentales se puede hacer independientemente. Sin embargo, hay ocasiones en que los niveles de uno de los factores son inherentes a las unidades experimentales, como por ejemplo, cuando se estudia el sexo en los animales en combinación con otros factores”.

El modelo del arreglo factorial puede ser descrito en primer término por el modelo del diseño correspondiente, con el subíndice de tratamientos corriendo hasta el número de combinaciones de los niveles de los factores. El efecto de los tratamientos puede ser luego desglosado en efectos principales y efectos de

1

Page 97: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

interacción bajo el modelo:

i = 1, 2,…, a niveles del factor A. j = 1, 2,…, b niveles del factor B. k = 1, 2,…, n repeticiones por tratamiento.

El efecto i está asociado con el factor A o sea el efecto principal, donde A va a tener de 1 a a niveles; aquí se tiene únicamente un efecto lineal.

El efecto j está asociado con el factor B que va de 1 a b niveles; aquí se estudia el efecto principal lineal y cuadrático.

7.2 Efecto principal de un factor.

¿Qué significa efecto principal? Es la ganancia o pérdida al pasar de un nivel a otro. Por ejemplo considere el arreglo siguiente.

Factor B

Factor 20 30A 40 52

El efecto principal del factor A podría interpretarse como la diferencia entre la respuesta promedio en el primero y segundo nivel de ese factor, numéricamente será:

Lo que significa, incrementar el factor A del nivel 1 al 2, produce un cambio en la respuesta promedio de 21 unidades.

Para factores cualitativos, el efecto principal solo representa la diferencia de medias entre las categorías probadas.

Para factores cuantitativos, el efecto principal representa el cambio en respuesta promedio al pasar del nivel bajo al nivel alto del factor.

Si los factores aparecen con más de dos niveles, se pueden definir comparaciones ortogonales entre niveles del factor cualitativo; o bien, efectos lineales, cuadráticos, cúbicos, etc. Entre los niveles de un factor cuantitativo.

7.3 Efectos de interacción.

Cuando en un experimento se investigan varios factores y uno de ellos influye sobre los efectos de otro, se dice que existe interacción entre estos factores. Es muy importante tener en cuenta la interacción para la interpretación de los resultados, porque da lugar a una variación distinta para cada factor, de la que hubiera producido actuando por si solo.

2

Page 98: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

Lo anterior significa que a la variación ocasionada por los factores considerados, actuando independientemente, se suma una nueva variabilidad, debido a la influencia de uno de los factores sobre el otro.

Una interacción es significativa cuando el efecto del factor A no es el mismo en todos los niveles del factor B, es decir, el efecto principal de A depende del nivel de B.

A menudo la interacción enmascara la significancia de efectos principales, por lo que la interpretación de esta es más útil que la de efectos principales. Por ejemplo considere el segundo arreglo.

Factor B

Factor 20 40A 50 12

Aquí el efecto de A en el primer nivel de B es:

A = 50 – 20 = 30

Mientras que en el segundo nivel de B el efecto de A es:

A = 12 – 40 = -28

Puede observarse que hay interacción entre los factores A y B, porque el efecto de A depende del nivel elegido de B.

Gráficamente la interacción podemos mostrarla de la siguiente manera.

Consideremos el primer arreglo. Grafiquemos la respuesta de los niveles del factor A para ambos niveles del factor B. Puede observarse que las rectas b1 y b2 son aproximadamente paralelas. Esto indica que no hay interacción entre los factores.

3

A1 A2

Respuesta

Factor A

B2

B1

B2

B1

605040

302010

Page 99: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

Si de manera análoga graficamos los datos del segundo arreglo, se observan que las rectas b 1 y b2 no son paralelos. Esto indica que existe interacción entre A y B.

La representación de este tipo de gráficas es muy útil para interpretar interacciones significativas; sin embargo, no es la única técnica, porque su interpretación es subjetiva y su apariencia a menudo es engañosa.

7.4 Ventajas de los arreglos factoriales.

1. Son más eficientes que los experimentos de un solo factor, ya que cada observación proporciona información acerca de cada uno de los factores por separado y de la interacción.

2. Un arreglo factorial es necesario cuando la interacción de los factores es significativa.

3. Los efectos de un factor son estimados a varios niveles de los otros factores, produciendo condiciones válidas en un rango de condiciones experimentales.

7.5 Comparaciones múltiples en un arreglo factorial.

Cuando la interacción es significativa, las medias pueden compararse de dos maneras.

1. Fijar uno de los factores a un nivel específico, y aplicar la prueba de rango múltiple Duncan a las medias de los niveles del otro factor.

2. Comparar todas las (a b) medias de tratamientos para determinar cuales difieren significativamente. En este análisis, diferencias entre las medias incluye efectos de interacción así como también de efectos principales.

Cuando la interacción no es significativa, las comparaciones deben hacerse entre las medias individuales de hileras y/o columnas (que representan las medias de los niveles de los factores en una tabla de doble entrada) para descubrir las diferencias específicas.

7.6 Análisis de varianza para un arreglo de dos factores.

El siguiente cuadro muestra un arreglo factorial con dos factores utilizando un diseño completamente al azar, se considera el caso de n repeticiones de las combinaciones de tratamientos determinados por a niveles del factor A y b niveles del factor B.

4

A1 A2

Factor A

Respuesta B2

B1

B1

B2

60

5040

3020

10

Page 100: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

B Total Promedio A 1 2 . . . b

1 y111 y121 . . . y1b1 y112 y122 . . . y1b2

. . . . . . . . . y11n y12n y1bn

T1 1. T1 2. . . . T1 b. T1 .. y1 ..

2 y211 y221 . . . y2b1 y212 y222 . . . y2b2 . . . . . . . . . y21n y22n y2bn

T2 1. T2 2. . . . T2 b. T2 .. y2 .. . . . . . . . . . . . . a ya11 ya21 . . . yab1 ya12 ya22 . . . yab2 . . . . . . . . . ya1n ya2n . . . yabn

Ta 1. Ta 2. Ta b. Ta .. ya.. Total T.1. T.2. . . . T.b. T...

Promedio y.1. y.2. . . . y.b. y...

Donde: Tij. = suma de las observaciones en la ij-ésima celda.Ti.. = suma de las observaciones para el i-ésimo nivel del factor A.Tj. = suma de las observaciones para el j-ésimo nivel del factor B.T... = suma de todas las a b n observaciones.yij. = media de las observaciones en la ij-ésima celda.

5

Page 101: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

yi.. = media de las observaciones para el i-ésimo nivel del factor A.y.j. = media de las observaciones para el j-ésimo nivel del factor B.y... = media de todas las a b n observaciones.

Concentrando los del cuadro anterior, tenemos.

B Total A 1 2 . . . b

1 T11. T12. . . . T1b. T1.. 2 T21. T22. T2b. T2.. . . . . . . . . . . . . . . . a Ta1. Ta2. . . . Tab. Ta..

Total T.1. T.2. . . . T.b. T...

El modelo al que se ajusta nuestro experimento es:

Lo anterior implica que cada una de las observaciones tiene influencia de los efectos principales y de la interacción si es que existe.

Sobre el modelo anterior se imponen las siguientes restricciones:

Las tres hipótesis a ser probadas son las siguientes:

H0: 1 = 2 = . . . = a = 0

H1: al menos una de las i’s no es igual a cero.

H0: 1 = 2 = . . . = b = 0

H1: al menos una de las j ’s no es igual a cero.

H0: ()11 = ()12 = . . . = ()ab = 0

H1: al menos una de las ()ij’s no es igual a cero.

Los cálculos de la suma de cuadrados para la fuente de variación de este arreglo son:

6

Page 102: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

Factor de corrección =

Suma de cuadrados totales =

Suma de cuadrados de A =

Suma de cuadrados de B =

Suma de cuadrados (A B) =

Suma de cuadrados del error = S.C.T. - S.C.A. - S.C.B. - S.C. (A B)

Estos cálculos se concentran en la tabla del análisis de varianza y se procede a su cálculo de la manera siguiente.

ANOVA PARA UN ARREGLO FACTORIAL DE DOS FACTORES

Fuente de Suma de Grados de Cuadrado F variación cuadrados libertad medio

Efecto principal

A S.C.A. a – 1

B S.C.B. b – 1 Interacción de dos factores S.C. (A B ) ( a – 1 ) ( b – 1 ) A B

Error S.C.E. a b ( n – 1 ) Total S.C.T. a b n – 1

En la tabla del análisis de varianza, lo primero que debe hacerse es ver si la interacción es significativa.

La interacción quiere decir que a la variación ocasionada por los factores en estudio, actuando independientemente, se suma una nueva variabilidad, debida a la influencia de uno de los factores sobre el otro.

7

Page 103: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

Si hay evidencia de que los factores interactúan, entonces dichos factores deben considerarse conjuntamente, es decir, no se puede concluir acerca de sus efectos en forma individual.

Los efectos principales pueden ser interpretados individualmente, solo cuando no hay evidencia de que los factores interactúan.

Si los efectos principales no son significativos pero hay evidencia de interacción, podría ser el resultado de un encubrimiento y plantear la necesidad de observar la influencia de cada factor en niveles fijos de otro.

7.7 Ejemplos de arreglo factorial con dos factores.

Ejemplo 1. Se llevó a cabo un experimento para probar tres sistemas de misiles y cuatro tipos diferentes de propulsores. La variable de salida fue el consumo de los propulsores para los 12 tratamientos. En el experimento se obtuvieron dos repeticiones de promedios de consumo en cada combinación de tratamientos, los datos después de codificarse se muestran a continuación.

PROMEDIOS DE IGNICIÓN DEL PROPULSOR

Sistema de Tipo de propulsor: misiles b1 b2 b3 b4

a1 34.0 30.1 29.8 29.0 32.7 32.8 26.7 28.9

a2 32.0 30.2 28.7 27.6 33.2 29.8 28.1 27.8

a3 28.4 27.3 29.7 28.8 29.3 28.9 27.3 29.1

Utilice un nivel de significancia de 0.05 para probar las siguientes hipótesis:

a) H0’: No existe diferencia entre los promedios de consumo de los tres diferentes misiles.

b) H0’’: No existe diferencia entre el promedio de consumo de los cuatro tipos de propulsor.

c) H0’’’: No existe interacción entre los diferentes sistemas de mísiles y los diferentes tipos de propulsor.

Hipótesis de trabajo

a) H0’ : 1 = 2 = 3 = 0

H1’ : Al menos una de las i’s no es igual a cero.

8

Page 104: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

b) H0’’: 1 = 2 = 3 = 4 = 0

H1’’: Al menos una de las j ’s no es igual a cero.

c) H0’’’: ()11 = ()12 = ()13 = ... = ()34 = 0

H1’’’: Al menos una de las ()ij’s no es igual a cero.

Del primer cuadro sumamos las celdas de cada tratamiento y construimos la tabla de totales siguiente:

Sistema de Tipo de propulsor: misiles b1 b2 b3 b4 Total

a1 66.7 62.9 56.5 57.9 244.0 a2 65.2 60.0 56.8 55.4 237.4 a3 57.7 56.2 57.0 57.9 228.8

Total 189.6 179.1 170.3 171.2 710.2

Obtención de las sumas de cuadrados:

Factor de corrección = FC. = 710.22 / 3(4)2 = 21016.00

Suma de cuadrados totales = 34.02 + 32.72 + ...+ 29.12 - FC. = 21107.68 - 21016.00 = 91.68

Suma de cuadrados de A = (244.02 + 237.42 + 228.82) / 8 - FC. = 21030.52 - 21016.00 = 14.52

Suma de cuadrados de B = (189.62 + 179.12 + 170.32 + 171.22) / 6 - FC = 21056.08 - 21016.00 = 40.08

Suma de cuadrados (A B) = (66.72 + 65.22 + ...+ 57.92) / 2 - S.C.A – S.C.B - FC

= 21092.77 - 14.52 - 40.08 - 21016 = 22.17

Suma de cuadrados del error = 91.68 - 14.52 - 40.08 - 22.17 = 14.91

Estos resultados se concentran en la tabla siguiente para su análisis correspondiente.

ANOVA PARA LOS PROMEDIOS DE IGNICIÓN DEL PROPULSOR

Fuente de variación Suma decuadrados

Grados delibertad

Cuadradomedio

F

Sistema de misiles 14.52 2 7.26 5.85Tipo de propulsor 40.08 3 13.36 10.77Interacción 22.17 6 3.70 2.98Error 14.91 12 1.24

9

Page 105: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

Total 91.68 23

Lo primero que tenemos que hacer en el ANOVA, es ver si existe interacción entre los factores principales. Como la probabilidad de tener una F = 2.98 es mayor a 5%, se acepta la hipótesis H 0’’’, y se concluye que no existe interacción entre los sistemas de misiles y los tipos de propulsor. Lo anterior significa que los sistemas de misiles no interfieren en los tipos de propulsor, ni estos en los niveles de misiles.

Como no existe interacción entre los factores principales, procedemos a concluir de manera particular para cada uno de los factores en el ANOVA, de lo contrario tendríamos que hacer comparaciones separadas para cada nivel dentro de cada uno de los factores.

Como la probabilidad de tener una F = 5.85 por mero azar es de 0.024 (menor a 5%), Se rechaza H0’ y se acepta H1’, concluyendo que sistemas diferentes de misiles implican diferentes tasas promedio de consumo del propulsor.

Como la probabilidad de tener una F = 10.77 es menor que 0.01 (menor a 5%), Se rechaza H0’’ y se acepta H1”, concluyendo que las tasas promedio de consumo del propulsor, no son las mismas para los cuatro tipos de propulsor.

7.7.1 Prueba de contrastes ortogonales en un arreglo factorial.

Dado que se encontraron diferencias entre los sistemas de misiles y no se encontró interacción, los totales de misiles (3) los ordenamos de menor a mayor y seleccionamos dos contrastes, comparando: a3 vs (a1 y a2 ), así como a1 vs a2 .

La elaboración de la tabla de coeficientes (C i) para las comparaciones de los contrastes es presentada a continuación.

Comparaciones a3 a2 a1

228.8 237.4 244.0

a3 vs (a1 , a2) -2 1 1

a1 vs a2 0 -1 1

Las sumas de cuadrados para los contrastes son:

Primer contraste:

S.C (C1) = 23.82 / 8(6) = 11.8008

Segundo contraste:

10

Page 106: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

S.C (C2) = 6.62 / 8(2) = 2.7225

Observe que 11.8008 + 2.7225 es igual a 14.5233 que es la suma de cuadrados para misiles en el ANOVA anterior.

Dado que también se encontraron diferencias para los tipos de impulsor, seleccionamos tres contrastes ortogonales comparando: (b3 y b4) vs (b2 y b1), así como b3 vs b4 y b2 vs b1.

La tabla de coeficientes Ci para las comparaciones es:

Comparaciones b3 b4 b2 b1

170.3 171.2 179.1 189.6

(b3 , b4) vs (b2 , b1) -1 -1 1 1

b3 vs b4 -1 1 0 0

b2 vs b1 0 0 -1 1

Las sumas de cuadrados para los contrastes son:

Primer contraste.

S.C (C1) = 27.22 / 6(4) = 30.8267

Segundo contraste.

S.C (C2) = 0.92 / 6(2) = 0.0675

Tercer contraste.

S.C (C3) = 10.52 / 6(2) = 9.18751

La suma de cuadrados de estos contrastes, debe ser igual a la suma de cuadrados de tipo propulsor del ANOVA anterior.

11

Page 107: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

El nuevo análisis de varianza mostrando los contrastes, se presenta en el siguiente cuadro.

Fuente de Suma de Grados de Cuadrado F

variación cuadrados libertad medio

Sistema de 14.52 2 misiles a3 vs (a1 , a2) 11.80 1 11.80 9.5 a1 vs a2 2.72 1 2.72 2.2

Tipo de propulsor 40.08 3 (b3 , b4) vs (b2 , b1) 30.82 1 30.82 24.9 b3 vs b4 0.07 1 0.07 0.06 b2 vs b1 9.19 1 9.19 7.4

Interacción 22.17 6 3.70 2.98

Error 14.91 12 1.24

Total 91.68 23

Como la P (F = 2.98) 0.10 (mayor a 5%) se acepta la hipótesis H0, concluyendo que no existe interacción entre tipos de misiles y tipos de propulsor, esto quiere decir que la variación en los sistemas de misiles no interfiere en el consumo de los propulsores, ni éstos influyen en el efecto de los tipos de misiles.

Como los factores no interactúan los efectos principales pueden ser interpretados de manera general.

Como la P (F = 9.5) 0.01 (menor a 5%) se rechaza la hipótesis H0 y se acepta la hipótesis H1, concluyendo que existe diferencia significativa entre estos grupos de niveles de misiles.

Como la P (F = 2.2) 0.10 (mayor a 5%) se acepta la hipótesis H0, concluyendo que no existe diferencia entre estos grupos de niveles de misiles.

Como la P (F = 24.9) 0.01 (menor a 5%) se rechaza la hipótesis H0 y se acepta la hipótesis H1, concluyendo que existe diferencia significativa entre estos grupos de tipos de propulsor.

Como la P (F = 0.06) 0.10 (mayor a 5%) se acepta la hipótesis H0, concluyendo que no existe diferencia entre estos grupos de tipos de propulsor.

Como la P (F = 7.4) 0.05 se rechaza la hipótesis H0 y se acepta la hipótesis H1 concluyendo que existe diferencia entre estos grupos de tipos de propulsor.

La clasificación de los sistemas de misiles que son iguales así como los tipos de propulsores, se presentan gráficamente con sus correspondientes promedios. No debe olvidarse que la variable que se analiza es el promedio de consumo de las combinaciones de los tratamientos.

a3 a2 a1

28.6 29.7 30.5

a a b b

12

Page 108: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

b3 b4 b2 b1

28.4 28.5 29.9 31.6

a a b b c c Para sistemas de misiles el ANOVA nos dice que: el sistema de misil tres es significativamente superior a todos los demás, mientras que el sistema de misil dos y uno son iguales estadísticamente.

Con relación a los tipos de propulsor el experimento nos indica que: el propulsor tres y cuatro son iguales estadísticamente pero a la vez superiores a todos los demás, le sigue el propulsor dos que es a la vez superior estadísticamente al propulsor uno.

Ejemplo 2. Un ingeniero diseña una batería para su uso en un dispositivo que será sometido a ciertas variaciones extremas de temperatura. El único parámetro de diseño que él puede seleccionar en este punto es el material de la cubierta de la batería, y tiene tres alternativas. Cuando el dispositivo se manufactura y se envía al campo el ingeniero no tiene control sobre los extremos de temperatura a que será expuesto el dispositivo, y sabe por experiencia que es probable que la temperatura influya en la duración efectiva de vida de la batería. Sin embargo, sí es posible controlar las temperaturas en el laboratorio de desarrollo de productos para los fines del ensayo.

El ingeniero decide probar tres materiales para la cubierta y tres niveles de temperatura (15, 70 y 125 °F) consistentes en el entorno de uso final del producto. Se prueban cuatro baterías (repeticiones) para cada tratamiento y las 36 pruebas se ejecutan al azar. Los resultados son los siguientes:

TIEMPO DE DURACIÓN EN HORAS DE VIDA DE LAS BATERÍAS

Tipo de material Temperatura en °F 15 70 125

1 130 34 20 74 80 82 155 40 70 180 75 58

2 150 136 25 159 106 58 188 122 70 126 115 45

3 138 174 96 168 150 82

13

Page 109: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

110 120 104 160 139 60

Las sumas de las observaciones en la ij-ésima celda (Tij.) son:

Tipo de material Temperatura en °F Total 15 70 125

1 539 229 230 998

2 623 479 198 1300

3 576 583 342 1501

Total 1738 1291 770 3799

Los cálculos para la obtención de las sumas de cuadrados se obtienen por:

Factor de corrección = FC. = 37992 / 3(3)4 = 400900.03

Suma de cuadrados totales = 478547 - FC. = 77646.97

S.C. de tipos de material = 4939005 / 12 - FC = 10683.72

S.C. de temperatura = 5280225 /12 - FC. = 39118.72

S.C. de interacción = 1841265 / 4 - FC. – S.C.M. - S.C.T. = 9613.78

S.C. del error = S.C.Tot. – S.C.M. – S.C.T. – S.C.I. = 18230.75

El análisis de varianza correspondiente para los cálculos anteriores se presenta a continuación.

ANOVA PARA LAS HORAS DE VIDA DE LAS BATERÍAS

Fuente de Suma de Grados de Cuadrado F

variación cuadrados libertad medio

Tipo de material 10683.72 2 5341.86 7.9

Temperatura 39118.72 2 19559.36 29.0

Interacción 9613.78 4 2403.44 3.6

Error 18230.75 27 675.21

Total 77646.97 35

Cuando en un experimento intervienen varios factores de variación y uno de ellos influye sobre los efectos de otro, se dice que existe interacción entre ambos. Es muy importante tener en cuenta la

14

Page 110: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

interacción, en la interpretación de los resultados, pues da lugar a una variación distinta para cada factor, de la que hubiera producido actuando por sí solo.

Por lo tanto lo primero a realizar después del ANOVA es verificar si existe interacción entre los efectos principales.

Como P (F = 3.6) es menor a 5% se rechaza la hipótesis H0, y se acepta la hipótesis alterna, con lo que se concluye que existe interacción significativa entre el tipo de material y la temperatura.

Dado que se detectó interacción entre los efectos principales, debemos ser muy cuidadosos en la interpretación de los factores tipo de material y temperatura, ya que no podemos concluir acerca de ellos de manera general.

Como auxiliar en la interpretación de los resultados construiremos una gráfica de tipo de material contra temperatura utilizando el valor promedio de cada combinación de tratamientos de la siguiente manera.

TIEMPO PROMEDIO DE VIDA POR UNIDAD EXPERIMENTAL

Tipo de material Temperatura 15 70 125

1 134.8 57.3 57.5

2 155.8 119.8 49.5 3 144.0 145.8 85.5

Si graficamos las horas promedio de vida de las baterías con las temperaturas tenemos:

Podemos observar que las gráficas no son paralelas lo que indica una interacción significativa. Con relación a la interpretación de las curvas podemos decir que en general; a menor temperatura mayor hora de vida de la batería; independientemente del tipo de material.

Al variar la temperatura de baja a intermedia, la duración aumenta con el material tipo 3; mientras que disminuye con los tipos de material 1 y 2.

15

Temperatura (° F)

Material tipo 3

Material tipo 1Material tipo 2

Duración promedio yij.

Page 111: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

Al variar la temperatura de intermedia a alta, la duración disminuye con los tipos de material 2 y 3; mientras que con el tipo 1 permanece constante.

Al parecer el material tipo 3 da los mejores resultados, si lo que se desea es menor pérdida de duración al cambiar la temperatura.

7.7.2 Prueba de rango múltiple Duncan en un arreglo factorial.

En razón de que el ANOVA anterior muestra diferencias significativas en la interacción así como para los factores principales, es conveniente llevar a cabo comparaciones entre las medias individuales de renglón o columna para descubrir las diferencias específicas, Para ello las pruebas de rango múltiple resultan de mucha utilidad.

Dado que la interacción resultó significativa, las diferencias en las medias de un factor (por ejemplo A) pueden ser ocultas por la interacción A B. La manera de analizarla es fijar el factor B en un nivel específico, y aplicar la prueba de rango Duncan a las medias del factor A en ese nivel.

Por ejemplo, se desea detectar diferencias en el nivel medio de temperatura (70° F), para los tres tipos de material. Los promedios de vida por batería para los tipos de material, ordenados de menor a mayor son:

Mat. 1 Mat. 2 Mat. 3 y12. y22. y32.

57.25 119.75 145.75

El error estándar de la diferencia de medias es:

El rango estudentizado significativo es:

2 32.91 3.06

El rango mínimo significativo será:

2 337.80 39.75

La diferencia de promedios es:

M3 - M1 = 88.50 vs 39.75 M3 - M2 = 26.00 vs 37.80 =

M2 - M1 = 62.50 vs 37.80

Existe diferencia significativa entre los promedios de los tipos de material. = No existe diferencia significativa.

Gráficamente los tipos de material estadísticamente iguales se muestran a continuación:

16

Page 112: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

Mat. 1 Mat. 2 Mat. 3

a a

b b

Este análisis indica que en el nivel de temperatura de 70°, las horas de vida para el tipo de material 2 y 3 resultan mejores estadísticamente, mientras que las horas de vida del material 1 es significativamente menor que las horas alcanzadas por el material 2 y 3.

De igual manera se debe llevar a cabo la prueba de Duncan para comparar los tres tipos de material, manteniendo fijos los niveles de temperaturas 15 y 125 °F.

Así mismo, de manera análoga se comparan los tres tipos de temperatura conservando constante cada uno de los niveles de tipo de material (resultando seis pruebas de comparación de medias en total).

7.9 Análisis de varianza para un arreglo con tres factores.

Se verá el caso de un experimento con tres factores A, B y C, cada uno con los niveles a, b y c respectivamente, en un diseño experimental completamente al azar. Se supone que se tienen n repeticiones para cada una de las combinaciones abc (tratamientos).

El modelo para un experimento con tres factores está dado por:

Donde:

i = 1, 2, …, a j = 1, 2, …, b k =1, 2, …, c l = 1, 2, …, n

Al igual que los diseños anteriores, para realizar las pruebas válidas de significancia, se debe asumir que los errores son valores de variables aleatorias independientes y con distribución normal, cada uno

con media cero y varianza común 2.

La filosofía general del análisis es la misma que se utiliza para experimentos de uno o dos factores. La suma de cuadrados se parte en ocho términos, cada uno representa una fuente de variación de las

cuales se obtienen estimaciones independientes de 2 para todos los efectos principales y los efectos de interacción.

Ejemplo. En la producción de un material en particular se investigan tres variables: A el efecto del operador con tres niveles (tres operadores), B el catalizador utilizado en el experimento con tres niveles (tres catalizadores) y el tiempo C del lavado del producto en seguida del proceso de enfriamiento con

17

Page 113: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

dos niveles (15 y 20 minutos). Se realizaron tres repeticiones en cada combinación de factores; los resultados se presentan a continuación:

TIEMPOS EN LA PRODUCCIÓN DEL MATERIAL

Tratamientos Repeticiones TotalI II III

A1B1C1 10.7 10.8 11.3 32.8A1B1C2 10.9 12.1 11.5 34.5A1B2C1 10.3 10.2 10.5 31.0A1B2C2 10.5 11.1 10.3 31.9A1B3C1 11.2 11.6 12.0 34.8A1B3C2 12.2 11.7 11.0 34.9A2B1C1 11.4 11.8 11.5 34.7A2B1C2 9.8 11.3 10.9 32.0A2B2C1 10.2 10.9 10.5 31.6A2B2C2 12.6 7.5 9.9 30.0A2B3C1 10.7 10.5 10.2 31.4A2B3C2 10.8 10.2 11.5 32.5A3B1C1 13.6 14.1 14.5 42.2A3B1C2 10.7 11.7 12.7 35.1A3B2C1 12.0 11.6 11.5 35.1A3B2C2 10.2 11.5 10.9 32.6A3B3C1 11.1 11.0 11.5 33.6A3B3C2 11.9 11.6 12.2 35.7

Total 200.8 201.2 204.4 606.4

Realice el análisis de variación para probar efectos significativos con un = 0.05

Lo primero que hacemos es concentrar del cuadro anterior los efectos del operador y catalizador, de operador y lavado, así como de catalizador y tiempo de lavado, en los siguientes cuadros:

TIEMPOS POR EFECTO DE OPERADOR Y CATALIZADOR

CatalizadorB

OperadorA

Total

1 2 31 67.3 66.7 77.3 211.32 62.9 61.6 67.7 192.23 69.7 63.9 69.3 202.9

Total 199.9 192.2 214.3 606.4

TIEMPOS POR OPERADOR Y TIEMPO DE LAVADO

Lavado Operador Total

18

Page 114: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

C A1 2 3

1 98.6 97.7 110.9 307.22 101.3 94.5 103.4 299.2

Total 199.9 192.2 214.3 606.4

TIEMPOS POR CATALIZADOR Y TIEMPO DE LAVADO

LavadoC

CatalizadorB

Total

1 2 31 109.7 97.7 99.8 307.22 101.6 94.5 103.1 299.2

Total 211.3 192.2 202.9 606.4

Los cálculos para la obtención de las sumas de cuadrados se presentan a continuación:

Factor de corrección = FC. = 606.42 / 3(3)2(3) = 6809.65

Suma de cuadrados de A = (199.92 + 192.22 + 214.32) / b c n – FC. = 122825.34 / 18 – F.C = 13.98

Suma de cuadrados de B = (211.32 + 192.22 + 202.92) / a c n – FC. = 122756.94 / 18 – F.C = 10.18

Suma de cuadrados de C = (307.22 + 299.22) / a b n – FC. = 183892.48 / 27 – F.C = 1.18

Suma de cuadrados (A B) = (67.32 + 66.72 +..+ 69.32) / c n - FC. - S.C.A – S.C.B.

= 41031.52 / 6 – 6809.65 – 13.98 – 10.18 = 4.78

Suma de cuadrados (A C) = (98.62 + 97.72 +..+103.42) / b n - FC. - S.C.A – S.C.C.

= 61449.56 / 9 - 6809.65 - 13.98 - 1.18 = 2.92

Suma de cuadrados (B C) = (109.72+ 97.72 +..+103.12) / a n - FC. – S.C.B - S.C.C.

= 61421.84 / 9 - 6809.65 - 10.18 - 1.18 = 3.64

Suma de cuadrados (A B C) = (32.82 + 34.52 +..+ 35.72) / n - FC. - S.C.A - S.C.B - S.C.C – S.C(A B) - S.C(A C) – S.C(B C) = 20553.68 / 3 – 6809.65 – 13.98 – 10.18 – 1.18 -4.78 – 2.92 – 3.64 = 4.89

Suma de cuadrados totales = 10.72 + 10.82 +…+ 12.22 - FC. = 6872.84 – 6809.65 = 63.19

19

Page 115: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

Suma de cuadrados error = S C T - S C A - S C B - S C C - S C(AB) - S C(AC)-S C(BC) - S C(ABC)

= 63.19 - 13.98 - 10.18 - 1.18 - 4.78 - 2.92 –3.64 -4.89 = 21.62

La tabla de análisis de varianza se presenta a continuación.

ANOVA DE TIEMPOS EN LA PRODUCCIÓN DEL MATERIAL

Fuente de variación Suma de cuadrados

Grados de libertad

Cuadradomedio

F

Efectos principales

A 13.98 2 6.99 11.65 B 10.18 2 5.09 8.48 C 1.18 1 1.18 1.97 ns

Interacción de dos factores

AB 4.78 4 1.20 2.00 nsAC 2.92 2 1.46 2.43 nsBC 3.64 2 1.82 3.03 ns

Interacción de tres factores

ABC 4.89 4 1.22 2.03 ns

Error 21.62 36 0.60

Total 63.19 53

* = existe diferencia significativa entre los promedios de los factores.ns = no existe diferencia significativa, ni interacción de los factores.

Dado que no se encontró interacción entre los factores, pero si diferencias estadísticas para el factor operador ( A ) y tipos de catalizador ( B ), procederemos

20

Page 116: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

al análisis correspondiente de los niveles de dichos factores, mediante la prueba de contrastes ortogonales.

Como se tienen dos grados de libertad para el factor operador (A), podemos plantear las comparaciones siguientes para los contrastes.

( a1 y a2 ) vs a3 así como a1 vs a2

La tabla de coeficientes Ci para las comparaciones es:

Comparaciones a2 a1 a3

192.2 199.9 214.3

( a1 , a2 ) vs a3 -1 -1 2 a1 vs a2 -1 1 0

Las sumas de cuadrados para los contrastes son:

Primer contraste S. C ( C1 ) = 36.52 / 18 (6) = 12.3356

Segundo contraste S. C ( C2 ) = 7.72 / 18 (2) = 1.6469

Dado que también se encontraron diferencias para los tipos de catalizador (B), las comparaciones que haremos son las siguientes:

( b2 y b3 ) vs b1 así como b2 vs b3

La tabla de coeficientes Ci para las comparaciones es:

Comparaciones b2 b3 b1

192.2 202.9 211.3

( b2 y b3 ) vs b1 -1 -1 2 b2 vs b3 -1 1 0

Las sumas de cuadrados para los contrastes son:

Primer contraste S. C ( C1 ) = 27.52 / 18 (6) = 7.00

Segundo contraste S. C ( C2 ) = 10.72 / 18 (2) = 3.18

21

Page 117: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

El nuevo análisis de varianza incluyendo a la suma de cuadrados de los contrastes es:

ANOVA DE TIEMPOS EN LA PRODUCCIÓN DEL MATERIAL

Fuente de Suma de Grados de Cuadrado F

variación cuadrados libertad medio

Operadores (A) 13.98 2 (a1 , a2) vs a3 12.34 1 12.34 20.6 * a1 vs a2 1.64 1 1.64 2.7 ns

Tipos de catalizador (B) 10.18 2 (b2 , b3) vs b1 7.00 1 7.00 11.7 * b2 vs b3 3.18 1 3.18 5.3 *

Tiempo de lavado (C) 1.18 1 1.18 1.9 ns

Interacción de dos factores A B 4.78 4 1.20 2.0 ns A C 2.92 2 1.46 2.4 ns B C 3.64 2 1.82 3.0 ns

Interacción de tres factores A B C 4.89 4 1.22 2.0 ns

Error 21.62 36 0.60

Total 63.19 53

* = existe diferencia significativa para los niveles de los factores A y B. ns = no existe diferencia significativa para el factor C, ni interacción entre factores.

La clasificación para los niveles de operadores se presenta a continuación.

a2 a1 a3

______________ _______ a a b b

El experimento nos dice que los operadores dos y uno son significativamente superiores al operador tres, y que los operadores dos y uno pueden considerarse como equivalentes (iguales estadísticamente).

22

Page 118: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

La clasificación para los niveles de tipos de catalizador se muestra a continuación.

b2 b3 b1

_______ _______ _______a a b b c c

Con relación a este factor, el experimento nos dice que: el catalizador dos es significativamente superior a todos los demás, que le sigue el catalizador tres que es a la vez superior estadísticamente al catalizador uno.

Apéndice 7.1 Empleo del software Minitab en un arreglo factorial.

Para ilustrar el empleo del software Minitab en la elaboración del ANOVA y el análisis residual, tomaremos el experimento para probar tres sistemas de mísiles y cuatro tipos diferentes de propulsores. Los pasos a seguir pueden ser:

1. En la columna C1 de la hoja de cálculo rotule Respuesta, en C2 Factor A y en C3 Factor B.

2. Para concentrar los niveles de cada uno de los factores serán empleados números en lugar de letras. La manera como es concentrada la variable de salida, los niveles del factor A y los niveles del factor B, puede ser:

Respuesta Factor A Factor B1 34.0 1 12 32.7 1 13 30.1 1 24 32.8 1 25 29.8 1 36 26.7 1 34 29.0 1 45 28.9 1 45 32.0 2 1. . . .. . . .. . . .24 29.1 3 4

3. Seleccione el menú Estadísticas.

4. Seleccione ANOVA.

5. Hacer clic en Dos factores.

6. Cuando aparezca el cuadro de diálogo Análisis de varianza de dos factores: Ingresar C1 en el cuadro de Respuestas. Ingresar C2 en el cuadro Factor de fila. Ingresar C3 en el cuadro Factor de la columna. Hacer clic en el cuadro Almacenar residuos. Hacer clic en el cuadro Almacenar ajustes. Hacer clic en Gráficas.

7. Cuando aparezca el cuadro de diálogo Análisis de varianza de dos factores- Gráficas: Hacer clic en Gráficas individuales.

23

Page 119: Temas basicos de estadistica diferencial.doc

Lic. Vicente Sánchez y Ramírez Arreglos factoriales___________________________________________________________________________________________________________________

Hacer clic en los cuadros de las gráficas que le interesen. Hacer clic en Aceptar. Hacer clic en Aceptar.

En los cuadros de diálogo, Minitab tiene otras posibilidades más que usted puede aprovechar seleccionando las opciones que desee.

24