universidad autónoma chapingo división de ciencias ... · pdf fileen la...

58
1 Universidad Autónoma Chapingo División de Ciencias Forestales Análisis de Diseños Experimentales con Igual Número de Submuestras Francisco J. Zamudio Sánchez Arturo A. Alvarado Segura Chapingo, México. 1996

Upload: dangmien

Post on 30-Jan-2018

222 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

1

Universidad Autónoma Chapingo División de Ciencias Forestales

Análisis de Diseños Experimentales con Igual Número de Submuestras Francisco J. Zamudio Sánchez

Arturo A. Alvarado Segura Chapingo, México.

1996

Page 2: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

2

PREFACIO El presente trabajo tuvo su origen en una consulta planteada por un estudiante acerca de cómo realizar el análisis de un diseño en parcelas divididas con submuestreo. Se revisó una amplia literatura disponible, encontrándose que los libros de Diseños Experimentales, Métodos Estadísticos o Modelos Lineales que tocan el tema de submuestreo, lo ejemplifican invariablemente en el Diseño Completamente al Azar o en el de Bloques al Azar, dejando implícito que los otros diseños se siguen de manera natural. Lo anterior no es cierto, ya que, para realizar un análisis donde hay submuestreo se requiere conocer la fuente de variación que conforma el error experimental, el cual, en el caso de los dos diseños antes citados es fácil, mas no es el caso en diseños con estructuras más complejas. Con esta motivación se trató de encontrar un algoritmo general para analizar diseños con igual número de submuestras. Para ello, se desarrolló la teoría necesaria a fin de determinar las sumas de cuadrados y las esperanzas de cuadrados medios pertinentes que establecieran un puente entre la variabilidad de las unidades experimentales, según el diseño general que se estuviera usando y la variabilidad de las submuestras. Por fortuna, se alcanzó el objetivo anterior y pudo constatarse en los resultados finales que el análisis de un diseño en estas condiciones es extremadamente fácil. El método estadístico se sintetiza en la construcción de dos tablas de Análisis de Varianza: una sobre las unidades experimentales y otra sobre las submuestras; de las anteriores, se construye la correspondiente al diseño que se esté analizando, completándose así el análisis. La forma de desarrollar el problema determinó la presentación de este trabajo. La primera parte (Capítulos 3, 4, 5 y 6) muestra la teoría implícita en el submuestreo y su manejo permite un excelente ejercicio docente en la forma de trabajar problemas en los diseños experimentales. La segunda parte (Capítulo 7) presenta los ejemplos y el algoritmo que resume en unas cuantas líneas la forma de llevar a cabo el análisis. De esta forma, la presentación separa a los dos grupos de lectores que pudieran estar interesados en el material. Aquellos que deseen conocer el sustento estadístico del submuestreo tendrán especial interés por conocer la primera parte del trabajo y quienes sólo quieran conocer cómo realizar el análisis podrán optar por la parte estrictamente metodológica. Es de especial interés este trabajo porque en la experimentación ocurre con mucha frecuencia el caso de submuestreo y si el objetivo es estimar las componentes de varianza en un estudio de progenies o procedencias (producción animal y vegetal) se obtendrán las estimaciones reales que proporciona el método de mínimos cuadrados. Si, de otro modo, se usan las medias aritméticas en casa parcela como usualmente se hace, se obtendrán estimaciones erróneas de estas componentes. Se debe remarcar el valor académico que se desprende del modo en que se hizo el análisis, pues permite observar con nitidez cómo se descompone la variación de la unidad experimental en los distintos factores que intervienen en un diseño, según sea el caso. Es de importancia para los autores que este trabajo sea de utilidad, por lo que cualquier sugerencia al mismo será bienvenida.

Fracisco J. Zamudio Sánchez Arturo A. Alvarado Segura

Otoño de 1994

Page 3: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

3

CONTENIDO Índice de cuadros Prefacio 1. Introducción 2. Antecedentes 3. Diseño de las unidades experimentales 3.1. Diseño de las unidades experimentales con submuestreo 3.2. Diseños de las unidades experimentales con submuestreo en notación matricial 3.2.1. Las sumas de cuadrados como normas al cuadrado de proyecciones

del vector de observaciones 3.2.2. Esperanza de una forma cuadrática 4. Diseño completamente aleatorio 4.1. Esperanzas de las sumas de cuadrados 5. Diseño de bloques completos al azar 5.1. Esperanzas de las sumas de cuadrados 6. Diseño general con el mismo número de submuestras por unidad experimental 6.1. Diseño general sobre las observaciones originales Yij

6.2. Diseño general sobre las variables Yri .

6.3. Aspectos metodológicos de la teoría general 7. Un algoritmo general para diseños experimentales con submuestreo 7.1. Ejemplo del diseño completamente aleatorio 7.2. Ejemplo del diseño bloques completos al azar 7.3. Ejemplo del diseño en cuadro latino 8. Literatura Citada ÍNDICE DE CUADROS Tabla A. Análisis de varianza de un diseño completamente aleatorio con submuestreo Tabla B. Análisis de varianza de un diseño de bloques completos al azar con submuestreo Tabla 1. Datos de tres unidades experimentales hipotéticas con dos submuestras por cada una Tabla 2. Presentación general de los datos de un diseño experimental con submuestreo Tabla 3. Sumas de cuadrados y esperanzas de los cuadrados medios del diseño

de las unidades experimentales con submuestreo Tabla 4. Sumas de cuadrados y esperanzas de los cuadrados medios del diseño

completamente aleatorio con submuestreo Tabla 5. Sumas de cuadrados y esperanzas de los cuadrados medios del diseño

bloques completos al azar con submuestreo Tabla 6. Sumas de cuadrados y esperanzas de los cuadrados medios del diseño

general con submuestreo sobre las variables originales Yij Tabla 7. Sumas de cuadrados y esperanzas de los cuadrados medios del diseño

sobre las variables transformadas Yri .

Tabla 8. Porcentaje de hinchamiento de tableros remojados durante dos horas. Tabla 9. Programa SAS para el análisis de un diseño completamente aleatorio con submuestreo. Tabla 10. Salida de SAS de un diseño completamente aleatorio con submuestreo. Tabla 11. Análisis de varianza a partir de Tabla 10. Tabla 12. Tratamientos aplicados en un lote experimental.

Page 4: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

4

Tabla 13. Programa SAS para analizar un diseño bloques completos al azar. Tabla 14. Contenido de nitrato (NO3) en ppm de muestras de suelo analizadas. Tabla 15. Salida de SAS del diseño bloques completos al azar con submuestreo Tabla 16. Análisis de Varianza a partir de la Tabla 15. Tabla 17. Incremento del diámetro normal (cm) de un bosque en cuatro años. Tabla 18. Programa SAS para analizar un experimento en cuadro latino con submuestreo. Tabla 19. Salida de SAS de un experimento en cuadro latino con submuestreo. Tabla 20. Análisis de varianza a partir de la Tabla 19.

Page 5: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

5

1. INTRODUCCIÓN En ciertas ocasiones, la validación de un conocimiento o la obtención de uno nuevo, se logra a través del análisis de los datos de un experimento planeado para tal fin; sin excepción, dichos datos se extraen de las unidades experimentales —se conocen como parcelas en el ámbito agronómico— que son sometidas aleatoriamente a condiciones diferentes por el experimentador. Esto es, la unidad experimental es la estructura básica del material experimental en la cual se registran los valores que toma la variable-respuesta en estudio; una unidad experimental puede ser un rodal en el bosque, un solo árbol, una cama semillera, una estufa de secado de madera, un corral de aves, un grupo de estudiantes, etc, y los tratamientos que son asignados podrían ser aclareos del área basal a diferente intensidad, utilización de reguladores del crecimiento, aspersiones con productos químicos, diferentes combinaciones controladas de temperatura y humedad relativa, manejo de dietas, métodos de enseñanza y muchos más. El valor de la variable-respuesta que permite estimar el efecto de los tratamientos, se mide en las muestras que pueden ser las unidades experimentales completas o una porción aleatoria de las mismas; en ambos casos que se mencionan, se toma una sola observación por cada unidad experimental. Sin embargo, por razones prácticas o para aumentar la precisión del experimento se pueden tomar dos o más observaciones por unidad experimental; a este hecho se le conoce como submuestreo y para hacer el análisis de los datos experimentales se deberá considerar una componente de submuestreo en el modelo lineal. La técnica del submuestreo se usa, en general, en los experimentos de diversos campos, así como en la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la información para estudiar el efecto de los tratamientos y de las otras componentes que afectan la variable respuesta, suele presentarse alguna de las siguientes posibilidades mal entendidas: a) Se considera cada observación o submuestra como repetición de un tratamiento determinado. b) Se obtienen los promedios de las submuestras por cada unidad experimental y se usan

únicamente estos valores para hacer el Análisis de Varianza (ANOVA). En este escrito se presenta la forma general del análisis de diseños experimentales con igual número de submuestras por unidad experimental. Para lograr esto, primero se desarrollan matricialmente las sumas de cuadrados (SC) y las esperanzas de los cuadrados medios (E(CM)) del diseño basado en las unidades experimentales y se resalta que los diseños más sencillos como el completamente aleatorio y el bloques completos al azar con submuestreo, pueden representarse a partir del diseño de las unidades experimentales. Después, se concatenan las SC y las E(CM) de los dos diseños más elementales ⎯el completamente aleatorio y el bloques al azar⎯ con las del diseño de las unidades experimentales para generar el Análisis de Varianza del diseño general con igual número de submuestras por unidad experimental; a partir del diseño general, es posible derivar el análisis de cualquier diseño experimental con submuestreo. Finalmente, para el lector que no tenga la intención de revisar las bases del análisis de diseños experimentales con submuestreo, se presenta un algoritmo sencillo de tres pasos (Capítulo 7), derivado de la teoría general, para resolver cualquier diseño experimental planeado con igual número de submuestras por parcela. Para ejemplificar, se desarrollan tres casos con datos reales resueltos con programa en SAS (Statistical Analysis System) que se generan siguiendo los pasos del mencionado algoritmo.

Page 6: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

6

2. ANTECEDENTES Los libros que abordan los diseños experimentales con submuestreo coinciden, en términos generales, en presentarlo sólo para los diseños completamente aleatorio y bloques completos al azar, sin vincular ambos análisis, de modo que no dejan explícita la forma de hacer el análisis con submuestreo de cualquier otro diseño; este enfoque es de gran utilidad para quien desee resolver problemas parecidos a los que se presentan en los textos. A continuación se escriben las tablas de análisis de varianza de los diseños completamente aleatorio y de bloques completos al azar, tomados de la literatura y haciendo homogénea la nomenclatura. En la Tabla A se presenta el análisis de varianza del diseño completamente aleatorio con submuestreo tomado de Snedecor & Cochran (1967) y Steel & Torrie (1988). Sea Ykij la j-ésima

submuestra de la unidad experimental i bajo el tratamiento k, con k =1,2, ..., t, i=1,2, ..., nk ,

j r=1 2, , ,K . En el experimento se tienen n nkk

t=

=∑

1 unidades experimentales y rn observaciones o

submuestras. Para presentar la Tabla A se hace uso de la siguiente notación punto:

Y Y Y Yrki kij

j

r

kiki

. ..= =

=∑

1

k kii

n

kk

kY Y Y Y

rnk

.. . ....= =

=∑

1

Y Y Y Yrnk

k

t

... .. ......= =

=∑

1

Tabla A. Análisis de varianza de un diseño completamente al azar con submuestreo.

FV GL SC CM Fcal

UE n −1 Y

rC

kik i

.,

2∑−

trat t −1 Y

rnC

kk

t

k

..2

1=∑

− SCtrat

t −1 CMtrat

CMEE

EE t nkk

t( )−

=∑ 1

1 SC UE SCtrat( )−

SCEEn t−

CMEECMEM

EM ( )n r −1 SCT SC UE− ( ) SCEMnr n−

Total rn −1 Y Ckijk i j

2

, ,∑ −

C Yrn

= ...2

La nomenclatura de la tabla anterior es: FV: Fuente de variación GL: Grados de libertad

Page 7: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

7

C: Factor de corrección SC: Suma de cuadrados CM: Cuadrado medio que es el resultado de dividir una SC entre sus correspondientes GL. Fcal: F calculada UE: Unidades experimentales trat: Tratamientos EE: Error experimental EM: Error muestral En lo sucesivo, se hará uso de la nomenclatura de la Tabla A para presentar las tablas de análisis de varianza. En la Tabla B se tiene el análisis de varianza del diseño bloques completos al azar con submuestreo, resultado de conjuntar las que presentan Ching (1971), Martínez Garza (1988) y Steel & Torrie (1988). Sea Yikj la j-ésima submuestra del tratamiento k que está dentro del bloque i, i = 1,2, ..., b, k = 1,2, ..., t, j = i, 2, ..., r. En el experimento se tienen n bt= unidades experimentales y rt submuestras.

Tabla B. Análisis de varianza de un diseño de bloques completos al azar con submuestreo.

FV GL SC Fcal

UE tb − 1 Y

rC

iki k

.2

,∑

bloq b −1 Y

rtC

ii

b

..2

1=∑

− CMbloqCEEE

trat t −1 Y

rbC

kk

t

. .2

1=∑

− CMtratCMEE

EE ( )( )b t− −1 1 SC UE SCbloq SCtrat( )− − CMEECMEM

EM ( )tb r −1 Y Yrijk

j

ik

i

22

∑∑ −⎡

⎣⎢⎢

⎦⎥⎥

.

,k

Total rtb −1 Y Cikji j

2

,k ,∑ −

C Yrtb

= ...2

; bloq: Bloques.

Page 8: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

8

3. DISEÑO DE LAS UNIDADES EXPERIMENTALES El diseño basado en las unidades experimentales se caracteriza por no ser un arreglo geométrico específico de los tratamientos en el terreno. Es un diseño conceptual con el que se puede visualizar cualquier diseño experimental; lo anterior significa que cualquier tipo de arreglo geométrico de los tratamientos sobre las unidades experimentales, se puede presentar como un diseño de las unidades experimentales. En este diseño cada observación Yij , con i n=1 2, , ,K , j r=1 2, , , ,K se explica por el efecto general de la media μ , un efecto aleatorio general controlado de la i-ésima unidad experimental Ui , más un efecto aleatorio no controlado ε ij de dicha observación dentro de la unidad experimental a la que pertenece, que es el error muestral. El modelo lineal propuesto que explica la j-ésima observación de la i-ésima unidad experimental en el diseño de las unidades experimentales es:

Y Uij i ij= + +μ ε (1)

bajo los supuestos de que ( )E Ui i= β , ( )var Ui = σ ε2 , ( )E ijε = 0 , ( )var ε σij m= 2 , ( )cov ,Ui ijε = 0 .

El efecto aleatorio de Ui se puede dividir en una componente fija β i y una componente aleatoria δ i , de forma que (1) se puede escribir como:

Yij i i ij= + + +μ β δ ε (2)

bajo el supuesto adicional que ( )δ σ εi N~ , .0 2

Se aclara que el modelo lineal en (2) es válido tanto para diseños en los que sólo se tome una muestra por parcela (que llamaremos diseños estándar) como para diseños experimentales con submuestreo; en el primer caso r = 1 y ε ij = 0. En este capítulo se aborda el diseño de las unidades experimentales con igual número de submuestras por unidad experimental, que se utilizará para plantear el diseño general. 3.1. Diseño de las unidades experimentales con submuestreo Cuando se habla de submuestreo en diseños experimentales, se hace referencia a que en cada unidad experimental a las que se asignan los tratamientos, se toman dos o más observaciones llamadas submuestras; y la suma de cuadrados total (SCT), independientemente del diseño experimental, queda conformada por la suma de cuadrados de las observaciones dentro de las unidades experimentales (SCEM) adicionada a la suma de cuadrados de las unidades experimentales (SC(UE)). Esta partición de la SCT, constituye el punto central para el análisis de cualquier diseño experimental con submuestreo, y se puede representar simbólicamente como:

SCT SC UE SCEM= +( ) . (3) A manera de ejemplo, se analizarán los datos de la Tabla 1. Se tienen 3 unidades experimentales y en cada una, se submuestrearon 2 observaciones, en la penúltima hilera están los totales de observaciones dentro de unidades experimentales y en el último renglón los promedios respectivos.

Page 9: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

9

Tabla 1. Datos de tres unidades experimentales hipotéticas con dos submuestras por cada una.

Unidad experimental (UE) UE 1 UE 2 UE 3

Submuestras (r=2)

4 5

5 3

1 4

total de UE Yi. 9 8 5 promedio de UE Yi. 4.5 4 2.5

Sea Yij la j-ésima submuestra de la i-ésima unidad experimental, i = 1, 2, 3 y j = 1, 2. Los totales

de cada unidad experimental se designan por Yi. ; el promedio de las observaciones para cada unidad experimental se denota por Yi. ; el total de todas las observaciones se denotará por Y.. y su promedio por Y.. . Es decir,

Y Y Yri ij

j

ri

. ..= =

=∑

1 Yi

Y Y Yrni

i

n

.. . ....= =

=∑

1 Y

en donde r representa el número constante de submuestras por cada unidad experimental y n el número total de unidades experimentales a las que se asignan los tratamientos. En el ejemplo r = 2 y n = 3. La suma de cuadrados total (SCT) está dada por:

( )SCT Y Yijj

r

i

n= −

==∑∑ ..

2

11 (4)

Para los datos de la Tabla 1, la SCT es: SCT = [(4 - 3.66)2 + (5 - 3.66)2 + (5 - 3.66)2 + (3 - 3.66)2 + (1 - 3.66)2 + (4 - 3.66)2 = 11.333 Asimismo, la suma de cuadrados de las unidades experimentales (SC(UE)) se calcula por:

( )SC UE r Y Yii

n( ) ..= −

=∑ .

2

1, (5)

que se ejemplifica con los datos de la Tabla 1 así: SC(UE) = 2[(4.5 - 3.66)2 +(4 - 3.66)2 + (2.5 - 3.66)2 = 2 [(0.7056) + (0.1156) + (1.3456) = 4.333 Finalmente, la suma de cuadrados de la variación de observaciones dentro de unidades experimentales, conocida como suma de cuadrados del error muestral (SCEM), se obtiene por

( )SCEM Y Yij ij

r

i

n= −

==∑∑ .

2

11, (6)

que para el ejemplo que se sigue es: SCEM = [(4 - 4.5)2 + (5 - 4.5)2 + [(5 - 4)2 + (3 - 4)2 + [(1 - 2.5)2 + ( 4 - 2.5)2 = 7.0

Page 10: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

10

Observe que adicionando los resultados hallados con las fórmulas (5) y (6), se obtiene el mismo valor que aplicando la fórmula (4). Por lo tanto, se constata numéricamente que se cumple la identidad (3) para los valores propuestos de Yij en la Tabla 1. A continuación se presentará la verificación algebraica de (3). Generalizando la idea, considere un experimento con n unidades experimentales en las cuales se toman r submuestras por cada una, y se presentan los datos como en la siguiente tabla:

Tabla 2. Presentación general de los datos de un diseño experimental con submuestreo.

i-ésima unidad experimental (UE) 1 2 . . . n

1 Y11 Y21 . . . Yn1 2M

j-ésima submuestra

r

Y12

M Y r1

Y22 M Y r2

. . . . . .

Yn2 M Ynr

total de la i-ésima UE Y1. Y2. . . . Yn. En donde: Yij : es la j-ésima submuestra de la i-ésima unidad experimental, i = 1, 2, ..., n y j = 1, 2, ..., r Yi. : totaliza las observaciones de la i-ésima unidad experimental Y.. : adiciona todas las Yi. Al generalizar, se pretende recalcar que la idea central del análisis de diseños experimentales con submuestreo, que toma forma en la expresión (3), es completamente válida indistintamente del diseño experimental con el que se esté trabajando. Esto es, haciendo caso omiso del diseño experimental, la suma de cuadrados de las desviaciones individuales (SCT) se puede hallar también, obteniendo la suma de cuadrados de las variaciones entre unidades experimentales (SC(UE)) que se adiciona a la suma de cuadrados de la variación entre observaciones dentro de unidades experimentales (SCEM). Para dejar claro el planteamiento anterior, se procederá a verificar la identidad (3): a) Se quiere verificar que SCT SC UE SCEM= +( ) b) Basándose en la fórmula (5),

( )SC UE r Y YiI

n( ) . ..= −

=∑

2

1

= − +⎛⎝⎜

⎞⎠⎟

===∑∑∑r Y Y Y Yi ii

n

i

n

i

n

. .. . ..2 2

1112

= − +∑ ∑r Y r Y

rnYr

rn Yrn

i i

r. .. . ..

( )

2

2

2

22

= − +∑ ∑Yr

Y Yrn

Yrn

i i. . ....2 22

Page 11: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

11

= − +∑Yr

Yrn

Yrn

i. .. ..2 2 22

de donde se obtiene la siguiente identidad,

SC UEY

rYrn

ii

n

( ) = −=∑ .

..

2

12

(7)

c) A partir de la fórmula (6),

( )SCEM Y Yij ij

r

i

n= −

==∑∑ .

2

11

( ) = − +==∑∑ Y Y Y Yij i ij ij

r

i

n2 2

112 . .

= − += ==∑ ∑ ∑ ∑∑∑ Y Y

rY Y

rijj

ri

ijj

ri

i

n2

1 1

2

21

2 . .

= − +==∑∑ ∑ ∑Y Y

rr Y

ijj

r

i

ni i

r2

11

2 2

22 . .

se obtiene la identidad (8)

SCEM Y Yriji

j

r

i

n= −

⎣⎢⎢

⎦⎥⎥==

∑∑ 22

11

. (8)

d) Observe que SC(UE) + SCEM, se obtiene adicionando los valores expresados en el lado derecho de (7) y (8):

Yr

Yrn

Y Yr

Y Yrn

iij

iij

j

r

i

n. . ..2 2

22

22

11

∑ ∑∑ ∑∑−⎛

⎝⎜⎜

⎠⎟⎟ + −

⎝⎜⎜

⎠⎟⎟ = −

==

..

e) Por otro lado, por definición, la suma de cuadrados total (SCT) es:

( )SCT Y Yijj

r

i

n= −

==∑∑ ..

2

11

( ) = − +==∑∑ Y Y Y Yij ijj

r

i

n2 2

112 .. ..

= − +== ====∑∑ ∑∑∑∑Y Y Y Yijj

r

i

n

ijj

r

i

n

j

r

i

n2

11

2

11112 .. ..

= − +==∑∑ Y rnY rnYijj

r

i

n2 2 2

112 .. ..

= −==∑∑ Y rnYijj

r

i

n2 2

11..

= −==∑∑ Y Y

rnijj

r

i

n2

11

2.. (9)

esto es, la suma de cuadrados total (SCT) es igual a la suma en el inciso d). Por lo tanto, queda demostrado que SCT SC UE SCEM= +( ) .

Page 12: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

12

3.2. Diseño de las unidades experimentales con submuestreo en notación matricial Todas las observaciones Yij de la Tabla 2, pueden presentarse en un vector columna Y de orden nr x 1.

[ ]Y Y Y Y Y Y Y Y Y Yr r n n nr= ′11 12 1 21 22 2 1 2L L L L

Escribiendo matricialmente el modelo lineal propuesto en (2) se tiene que:

Y i ij= + +Cβ δ ε (10)

o se puede escribir de forma equivalentemente como:

( )

11

12

1

21

22

2

1

2

1 1

1 1 0 01 1 0 0

1 1 0 01 0 1 01 0 1 0

1 0 1 0

1 0 0 11 0 0 1

1 0 0 1

YY

YYY

Y

YY

Y

r

r

n

n

nrnr nr n

M

M

M

M

L

L

M M M M

L

L

L

M M M L M

L

M M M M

L

L

M M M M

L

⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥

=

⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥

+x x

( )

ββ

β

δδ

δδδ

δ

δδ

δ

εε

εεε

ε

εε

ε

0

1

1

11

12

1

21

22

2

1

2

11

12

1

21

22

2

1

2

M

M

M

M

M

M

M

M

M

n n

r

r

n

n

nrnr

r

r

n

n

nrnr

⎢⎢⎢⎢

⎥⎥⎥⎥

+

⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥

+

⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥

+ x1

x 1 x 1

En el modelo (10), C es la matriz diseño basada en las unidades experimentales; β corresponde a los parámetros de efectos fijos de las unidades experimentales; δi a los efectos aleatorios (error experimental); y εij a los efectos aleatorios de submuestras dentro de unidades experimentales

(error muestral). A partir del vector Y de tamaño nr, se reescribirán las expresiones (7), (8) y (9) en notación matricial, usando formas cuadráticas, para facilitar la presentación de los datos y los resultados en forma concisa. Definición 1. Sea A una matriz cuadrada de orden n y Y un vector de observaciones de orden n x 1; la expresión Y Y′A se define como una forma cuadrática en Y y se dirá que A es la matriz asociada a la forma cuadrática Y Y′A , tal como lo menciona Graybill (1969). A partir de (7) se puede verificar que,

Page 13: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

13

Y

rYnr

Yr nr

Yi

i

n

ii

nnr

... '

2

12

1

1 1=

=

∑∑− = ⎡⎣⎢

⎤⎦⎥−

⎣⎢

⎦⎥A J (11)

donde,

1 11 1

1 1

0 0

0 01 r ri

r r r r

r r r r

r r r r

r r r r

n

n

nrxnr

r

r r

r

r r

A

J O O OO J O OO O J O

O O O J

J O⎛⎝⎜

⎞⎠⎟=

⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥

=⎡

⎢⎢⎢

⎥⎥⎥

=⎡

⎢⎢⎢

⎥⎥⎥=

× ×

L

L

L

M M M M

L

L

M M

L

L

M M

L

con y ; y

Jnr nr nr

nr nr

= =⎡

⎢⎢⎢

⎥⎥⎥

×

1 11 1

1 1

`L

M M

L

;

ya que,

Y

r

Y

r rY Y

ii

nij

j

r

i

n

ijj

r

ijj

r

i

n.2

1 1

2

1

1 11

1= ==

= ==

∑ ∑∑∑ ∑∑=

⎝⎜⎜

⎠⎟⎟

=⎛

⎝⎜⎜

⎠⎟⎟⎛

⎝⎜⎜

⎠⎟⎟

⎣⎢⎢

⎦⎥⎥

.

Haciendo,

i r i i i i

r r r

r r r

r r r nr nr

e e e=

⎢⎢⎢

⎥⎥⎥

= =

⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥

010

A A

O O O

O J O

O O O

'

L L

M M M

L L

M M M

L L x

,

se tiene que,

( ) ( )[ ]( )

ii

n

i ii

n

i i

ii

n

Y

r rY Y

rY Y

rY Y

e e e e.

' ' ' '

'

2

1

1

1

1 1

1

=

=

=

∑∑ ∑

= =

= A

Además, el segundo término de (7) se puede reescribir así:

..2 11

2

11 11Yrn

Y

rn

Y Y

rn

ijj

r

i

nij

j

r

i

nij

j

r

i

n

=

⎣⎢⎢

⎦⎥⎥

=

⎣⎢⎢

⎦⎥⎥

⎣⎢⎢

⎦⎥⎥== == ==

∑∑ ∑∑ ∑∑

[ ] [ ] x x 1 x x 1=1 1 1 1 1 1 11 1nr

Y Ynr nr nr nrL L

[ ] = = ⎡⎣⎢

⎤⎦⎥

1 1 1 1 1 1nr

Y Y Ynr

Y' ' '

Page 14: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

14

= ⎡⎣⎢

⎤⎦⎥

Ynr

Ynr' 1J

Observe que la matriz asociada a la forma cuadrática en (11) es:

r r r

r r r

r r r nr nr

B D DD B D

D D B

L

L

M M M

M

⎢⎢⎢⎢

⎥⎥⎥⎥

x

con,

r

r r

r

r r

r nr r nr

r nr r nr

nr nr

nr nr

B D=

− −

− −

⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥

=

− −

− −

⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥

1 1 1 1

1 1 1 1

1 1

1 1

L

M M

L

L

M M

L x x

y .

La SCEM de la identidad (8) presentada matricialmente es:

SCEM Y Y Yr

Yii

n= − ′ ⎡

⎣⎢

⎦⎥

=∑' 1

1A

= ′ −⎡

⎣⎢

⎦⎥

=∑Y

rYnr i

i

nI A1

1 (12)

donde Inr es una matriz identidad de orden nr.

Ya que, [ ]Y Y Yijj

r

i

n2

111

==∑∑ = ' x 1 y

Y

rY

rY

ii

n

i

n

i

.2

1

1

1=

=

∑∑= ′⎡

⎣⎢

⎦⎥A , la matriz asociada a la forma cuadrática en

(12) es:

A I A= −⎡

⎣⎢

⎦⎥

=∑nr ii

n

r1

1

o de forma equivalente es:

A

B O OO B O

O O O B

=

⎢⎢⎢⎢

⎥⎥⎥⎥

r r r

r r r

r r r r

L

L

M M M,

con

Page 15: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

15

O Br

r r

r

r r

r r r

r r r

r r r

=

⎢⎢⎢⎢

⎥⎥⎥⎥

=

− − −

− − −

− − −

⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥

0 0 00 0 0

0 0 0

1 1 1 1

1 1 1 1

1 1 1 1

L

L

M M M

L

L

L

M M M

L x

x

y

A continuación, se escribirá la suma de cuadrados total (SCT) usando matrices. A partir de la identidad (9), se puede verificar que:

ijj

r

i

nY

Yrn

Y Y Ynr

Y2

1

2

1

1 11− = ′ − ′⎡⎣⎢

⎤⎦⎥==

∑∑ .. ' ;

al factorizar se tiene que:

SCT = −⎡⎣⎢

⎤⎦⎥

Ynr

Ynr nr' I J1 (13)

y la matriz asociada a la forma cuadrática en (13) se puede escribir como:

1 1 1 1

1 1 1 1

1 1 1 1

− − −

− − −

− − −

⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥

nr nr nr

nr nr nr

nr nr nr nr nr

L

L

M M M

L x

3.2.1. Las sumas de cuadrados como normas al cuadrado de proyecciones del vector de

observaciones Y A continuación se reescribirán las expresiones (11), (12) y (13) usando proyectores de matrices; por lo que, es importante la siguiente definición: Definición 2. Sea X una matriz de orden n x m; la expresión ( )X X X X' '−1 se define como el proyector de X y se denota como PX . De acuerdo a Searle (1966), se mencionan sin verificar las siguientes propiedades del proyector PX : Propiedad 1. PX es simétrico e idempotente. Propiedad 2. El rango (r) de una matriz idempotente es igual a su traza (tr). La matriz C del modelo (10) puede particionarse como:

[ ]C C= C1 2 , donde,

Page 16: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

16

C

nr n

1

1

2

11

111

1

11

1

1 0 01 0 0

1 0 00 1 00 1 0

0 1 0

0 0 10 0 1

0 0 1

=

⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥

=

⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥× ×

M

M

M

M

L

L

M M

L

L

L

M M

L

M M

L

L

M M

L

r n

C

.

.

.

.

De acuerdo a la Definición 2, se presentan los proyectores de C1 2 y C . Así:

( )PC C C C C1 1 1 1

11=

−' '

donde,

( ) ( ) [ ]C C nr C Cnr

C C Cnrnr nr nr nr C1

'1 1

'1 1

'1 x

= = ; ; ; '− −

= =1

11 1 1 1

1

1 1 111

L P .

El proyector de la matriz C2 es:

( )P C C C CC2 2 2 21

2= ′ ′− donde,

( )′ =

⎢⎢⎢⎢

⎥⎥⎥⎥

′ =

⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥

−C C C C2 2 2 21

0 00 0

0 0

1 0 0

0 1 0

0 0 1

rr

r

r

r

rn n

L

L

M M M

L

L

L

M M M

L x

;

( )C C C P

J 0 0

0 J 0

0 0 J

C2 2 21 1

0 00 0

0 0

1

1

1

11

12

′ =

⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥

=

⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥

r

r

r

r

r

r

r

r r r

r r r

r r r

L

L

M M M

L

L

L

M M M

L

;

De acuerdo a Propiedad 2, de la Definición 2, se tiene que ( ) ( )r y rP PCC n1 2

1= = .

Usando P PCC1 2 y , se reescriben las expresiones (11), (12) y (13):

( ) ( )SC UE Y YC= −' P PC2 1 (14)

Page 17: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

17

( )SCEM Y Ynr= −' I PC2 (15)

( )SCT Y Ynr C= −' I P1

(16)

A continuación se escribirán los grados de libertad asociados a (14), (15) y (16). Para esto, es necesaria la definición siguiente: Definición 3. Los grados de libertad (GL) correspondientes a una forma cuadrática de la forma Y Y' A , se definen como el rango (r) de la matriz A asociada a dicha forma cuadrática. Observe que la matriz A asociada a la forma cuadrática Y Y' A es idempotente. Haciendo uso de Definición 3, se tiene que los GL correspondientes a (14), (15) y (16) son n-1, nr-n y nr-1, respectivamente. En donde también se hace uso de que [ ] ( ) ( )tr tr trA B A B+ = + . 3.2.2. Esperanza de una forma cuadrática La esperanza de la forma cuadrática Y Y' A se denota como [ ]E Y Y' A . A continuación se muestra que se cumple:

[ ] ( )[ ] ( ) ( )E Y Y Var Y E Y E Y' 'A A A= +tr (17) ya que,

[ ] [ ] [ ] ( )[ ] ( )[ ]E Y Y E Y Y E YY E YY E YY' ' ' ' 'A A A A A= = = =tr tr tr tr . De la expresión anterior,

( )[ ] ( )[ ] ( )[ ] ( )[ ][ ]( )[ ] ( )[ ] ( )[ ] ( ) ( )[ ] ( ) ( )[ ]

( ) ( ) ( )

E YY E Y E Y E Y Y E Y E Y

E Y E Y Y E Y Y E Y E Y E Y Y E Y E Y E Y

Var Y E Y E Y

′⎛⎝⎜

⎞⎠⎟ = − + − +

= − − + − + − +

= +

'

' ( )' ' '

'

Por lo que, ( )[ ] ( ) ( ) ( )[ ][ ]tr trA AE YY Var Y E Y E Y' '= +

( ) ( ) ( )[ ] tr= +A AVar Y E Y E Y '

( )[ ] ( ) ( )[ ] tr tr= +A AVar Y E Y E Y '

( ) ( ) ( ) = tr tr A AVar Y E Y E Y+ ′⎡⎣⎢

⎤⎦⎥

⎡⎣⎢

⎤⎦⎥

Como la traza de un escalar es el mismo número, entonces se obtiene la expresión en (17), que es la esperanza de una forma cuadrática. A continuación se desarrolla la matriz de varianzas y covarianzas del vector de observaciones Y , a partir de la expresión (17):

Del modelo (9), Yij i i ij= + + +μ β δ ε se tienen los siguientes supuestos: a) ( )δ σ εi ~ , ,0 2

( )b) ε σij m~ , ,0 2 ( )c) cov , , .δ εi ij i j= ∀0

Entonces,

Page 18: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

18

( ) ( )var ij i ijY E= +⎡⎣⎢

⎤⎦⎥

δ ε2

( )[ ] = + +E i i ij ij2 22δ δ ε ε

( ) ( )( ) ( ) = + +E E Ei i ij ij2 22δ δ ε ε

( ) ( ) = +var vari ijδ ε

= +σ σε2 2

m ; además,

( ) [ ]( )( )[ ]( )[ ][ ]

Cov Y Y

E

E

E

ij ij i i ij i i ij

i ij i ij

i i ij ij i ij ij

i

, cov ,

'

′ = + + + + + + ′

= + +

= + ′ + + ′

= =

μ β δ ε μ β δ ε

δ ε δ ε

δ δ ε ε δ ε ε

δ σ ε

2

2 2

Por lo que, la matriz de varianzas y covarianzas, denotada por R, de la i-ésima unidad experimental se puede escribir como:

R

2

=

++

+

⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥

m

m

m r r

2 2 2

2 2 2 2

2 2 2 2

σ σ σ σσ σ σ σ

σ σ σ σ

ε ε ε

ε ε ε

ε ε ε

L

L

M M M

L x

y la matriz de varianzas y covarianzas del vector Y es:

Var Y

nr nr

( ) =

⎢⎢⎢⎢

⎥⎥⎥⎥

R O OO R O

O O R

L

L

M M M

L x

(18)

Así también, a partir de la expresión (17) se presentarán enseguida las esperanzas de la suma de cuadrados de las unidades experimentales y del error muestral que se denotarán como E[SC(UE)] y E[SCEM], respectivamente. Pero antes, es importante el siguiente Lema: Lema 1. Sea W una matriz de n x r y Z WD= , entonces P Z ZW = ya que,

( ) ( )P Z W W W W Z W W W W WD WID WD ZW = = = = =− −' ' ' '1 1 . A continuación se desarrolla la esperanza de la suma de cuadrados de las unidades experimentales dada en (14):

( )[ ] ( )[ ]( )[ ] ( )

E SC UE E Y Y

Var Y E Y E Y

C

C C

= −

= − + −

'

( ) ( )' ( )

P P

P P P P

C

C C

2 1

2 1 2 1tr

De la expresión anterior, es necesario conocer:

Page 19: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

19

( ) ( ) ( )

( ) ( )

P C C C C

C C C C I

C2 2 2 2 2

2 2 2 211 1

Var Y Var Y

rVar Y

r n

= ′ ′

= ′ ′ =− ya que , ;

( )( )

( )=

+

+

+

⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥

1

1 0 00 1 0

0 0 1

2

2 2

2 2

2 2r

r

r

r

m r

m r

m r

C

σ σ

σ σ

σ σ

ε

ε

ε

' ' '' ' '

' ' '

L

L

M M M

L

.

Así que:

P

J O O

O J O

O O J

C2

1

2

2

2

Var Yr

r

r

r

r

r

r

( ) =

⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥

σ

σ

σ

L

L

M M M

L

donde, σ σ σε

22 2

rrm= + . Entonces,

( )[ ]a) tr PC2

1 2 2Var Y

r rnr n

r=

⎣⎢

⎦⎥ =

σ σ,

y b) ( ) ( ) ya que E Y E Y' ' ' .P C P C C C P C CC C C2 2 2

= = ′ =β β β β Por otro lado, de la misma expresión, hay que conocer también:

( ) [ ] ( )PC nr nrVar Ynr

Var Y1

1 1 1=

=⎡

⎣⎢⎢

⎦⎥⎥

1 1 1 1 12 2 2

nr r r rnr r r rσ σ σ' ' 'L ;

así que,

PC

r r r

r r r

r r rnr nr

Var Ynr

r r r

r r r

r r r

1

1

1 1 1

1 1 1

1 1 1

2 2 2

2 2 2

2 2 2

( )

' ' '

' ' '

' ' '

=

⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥

σ σ σ

σ σ σ

σ σ σ

L

L

M M M

L x

;

para escribir,

Page 20: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

20

c) ( )( )tr PC Var Ynr

nrr r1

1 2 2= =σ σ

.

Asimismo, se tiene que.

d) ( ) ( )E Y E YnrC C nr nr' ' ' ' 'P C P C C C

1 1

1 1 1= =β β β β

Con todo lo anterior, es posible presentar la esperanza de la suma de cuadrados de las unidades experimentales como sigue:

( ) ( )E SC UEr

n ri

n

i( ( ) = − + −=∑

2

1

21σ β β (19)

donde, β β==∑

11n i

i

n, ya que,

( )[ ] ( )[ ]E SC UE E Y Y

rn

nr

C

nr nr

= −

= − + −

'

( ) ' ' ' '

P P

C C C C

C2 1

21 1 1 1σ β β β β

donde,

( ) ( )β β β β' ' ' 'C C C J C− = + − +⎡

⎣⎢

⎦⎥

= =∑ ∑

1 12

1 1

2

nrr

nrrnr i

I

n

ii

nμ β μ β

( ) ( ) = + − +⎡

⎣⎢

⎦⎥

⎣⎢⎢

⎦⎥⎥= =

∑ ∑rni

i

n

i

n

iμ β μ β2

1 1

21

( ) = −=∑r ii

nβ β

1

2

.

Ahora se procede a desarrollar la esperanza de la suma de cuadrados del error muestral (E(SCEM)). Sabemos que: ( )[ ]E SCEM E Y Ynr( ) '= −I PC2

( ) ( )[ ] ( ) ( ) ( ) tr= − + −I P I PC Cnr nrVar Y E Y E Y2 2

'

De donde hay que escribir que:

( )[ ] ( )a) tr Inr mVar Y nr= +2 2σ σ ε

( )[ ] ( ) ( )b) tr PC2

1 2 2 2Var Yr

n n rm= = +σ σ σ ε

c) E Y E Ynr( )' ( ) ' 'I C C= β β

d) ( )E Y E Y' ( ) ' 'P C CC2= β β

Por lo tanto, se puede escribir la esperanza de la SCEM como:

Page 21: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

21

( )E SCEM nr nm m( ) ( )= + − +2 2 2 2σ σ σ σε ε

( ) = −σ m n r2 1 (20) El resumen de los resultados del diseño basado en las unidades experimentales se presenta a continuación:

Tabla 3. Sumas de cuadrados y esperanzas de los cuadrados medios del diseño de las unidades experimentales.

FV GL SC E(CM)

UE

n −1 ( )Y YC' P PC2 1− ( )

2 2

11σ β βr

rn i

i

n+

−−

=∑

EM ( )n r −1 ( )Y Ynr' I PC−2

m2σ

Total nr −1 ( )Y Ynr C' I P−1

22 2σ σ σ εr

rm= +

Page 22: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

22

4. DISEÑO COMPLETAMENTE ALEATORIO CON SUBMUESTREO Considere que a n unidades experimentales, se les asignan aleatoriamente t tratamientos k t=1 2, , ,K y que el k-ésimo tratamiento se aplica a nk unidades experimentales de tal modo que

n nkk

t=

=∑ .

1

El modelo lineal original (2) transformado al diseño completamente aleatorio se presenta como:

kij k ki kijY = + + +μ τ δ ε (21) en el que se entiende que cada Ykij es la j-ésima submuestra de la i-ésima unidad experimental que

lleva el tratamiento k, con k = 1, 2, ..., t, i = 1, 2, ..., nk, y j = 1, 2, ..., r. Observe que el efecto fijo βi

de la unidad experimental Ui del modelo (2) ha sido sustituido por el efecto del tratamiento τ k que lleva dicha unidad experimental; así también, el efecto aleatorio de la unidad experimental (error experimental) y el error aleatorio de la j-ésima submuestra dentro de la i-ésima unidad experimental se han sustituido por errores que a los anteriores incorpora la presencia del tratamiento. Los supuestos del modelo lineal del diseño completamente aleatorio en (21) son los siguientes:

a) ( ) ( )E ki kiδ δ σ ε= =0 2var b) E kij kij m( ) var( )ε ε σ= =0 2 c) cov( ) , ,,δ εki kij k i j= ∀0 El modelo (21) replanteado de forma matricial es como sigue:

Y = + +Xτ δ ε (22) en donde por ahora, basta saber que [ ]X T= 1 y T es la matriz diseño basada en los tratamientos. Como en el caso del diseño original —basado en las unidades experimentales—, donde el efecto aleatorio de las unidades experimentales se particiona en una componente fija βi y otra aletoria δi, aquí en el diseño completamente al azar, el efecto aleatorio combinado de la unidad experimental y el tratamiento se particiona en un efecto fijo acreditable al tratamiento y uno aleatorio (error experimental) adjudicado al efecto combinado unidad-tratamiento. Por lo tanto, la suma de cuadrados de las unidades experimentales (SC(UE)) se particiona en la suma de cuadrados de tratamientos (SCtrat) y la suma de cuadrados del error experimental (SCEE); para este diseño en particular, la SCEE se da por la variación existente entre unidades experimentales tratadas análogamente, es decir, por la variación de las nk unidades experimentales dentro del tratamiento k. En lo que sigue, se considera que las primeras n1 unidades experimentales del vector Y llevaron el tratamiento 1, las segundas n2 unidades experimentales el tratamiento 2, así sucesivamente, de modo que las últimas nt unidades experimentales recibieron el tratamiento t. A continuación se presenta de forma ampliada la matriz C de orden nr x (n + 1) del modelo (10), para observar la asignación de los t tratamientos a las n unidades experimentales en un diseño completamente al azar.

Page 23: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

23

1 2 1 2 1 2 2T T T

C

1

1 2

1 1 0 0 0 0 0 0 0 01 0 1 0 0 0 0 0 0 0

1 0 0 1 0 0 0 0 0 01 0 0 0 1 0 0 0 0 01 0 0 0 0 1 0 0 0

t

t

r r r r r r r r r r

r r r r r r r r r r

r r r r r r r r r r

r r r r r r r r r r

r r r r r r r r r

n n nμ L L L L

L L L L

L L L L

M M M M M M M M M

L L L L

L L L L

L L L L

=0

1 0 0 0 0 0 1 0 0 0

1 0 0 0 0 0 0 1 0 01 0 0 0 0 0 0 0 1 0

1 0 0 0 0 0 0 0 0 1

r

r r r r r r r r r r

r r r r r r r r r r

r r r r r r r r r r

r r r r r r r r r r

M M M M M M M M M M

L L L L

M M M M M M M M M M

L L L L

L L L L

M M M M M M M M M M

L L L L

⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥

o de manera equivalente, se puede escribir en términos de sus submatrices como: [ ]C T T T= 1 1 2nr tL

A partir de la asignación de los t tratamientos a las n unidades experimentales de la matriz diseño C, se deriva la matriz X que corresponde a los tratamientos y es de nr x (t + 1). En la matriz C, la primera columna corresponde a μ y las restantes n columnas corresponden a las observaciones de las unidades experimentales, a las cuales, se asignaron los tratamientos. Por su parte, la primera columna de la matriz diseño X, que corresponde al efecto de μ, se denota como C1 , del mismo modo que en C; las siguientes t columnas de los tratamientos, conforman la submatriz T y se denominan X1 , X 2 ,, ..., X t ; esto es,

[ ]T = X X X t1 2 L y

Page 24: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

24

X X X

T

X

μ 1 2

1 1 0 01 1 0 0

1 1 0 01 0 1 01 0 1 0

1 0 1 0

1 0 0 11 0 0 1

1 0 0 1

L

L

L

M M M M

L

L

L

M M M M

L

M M M M

L

L

M M M M

L

t

=

⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥

La suma de cuadrados de los tratamientos (SCtrat) está dada por:

SCtrat Y Y Y YC= −' 'P PT 1 y al factorizar se obtiene:

( )SCtrat Y YC= −' P PT 1 (23)

donde,

( )P P T T T TTC nry

1

1 11 1= = −' ' '

A continuación se presenta el desarrollo del proyector PT anterior:

T T' =

⎢⎢⎢⎢

⎥⎥⎥⎥

n rn r

n rt n n

1

2

0 00 0

0 0

L

L

M M M

L x

; ( )T T' − =

⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥

1

1

2

1 0 0

0 1 0

0 0 1

n r

n r

n rt n n

L

L

M M M

L x

;

premultiplicando a (T´T)-1, por T:

( ) T T T′ =

⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥

−1

1 1 1

2 2 2

1 1 1 0 0 0 0 0 0

0 0 0 1 1 1 0 0 0

0 0 0 0 0 0 1 1 1

n r n r n r

n r n r n r

n r n r n rt t t

L L L L

L L L L

M M M M M M M M M

L L L L

;

Page 25: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

25

y finalmente, el proyector de la matriz T es:

( )( )

( )

P

J 0 0

0 J 0

0 0 J

T =

⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥

n r

n r

n r

n r

n r

t n rt

11

21

1

1

2

L

L

M M M

L

donde,

J n r

n r n r

k

k k

k t=

⎢⎢⎢⎢

⎥⎥⎥⎥

=

1 1 11 1 1

1 1 1

1

L

L

M M M

L

K

x

, , .

En la suma de cuadrados del error experimental (SCEE) ⎯esto es, la suma de cuadrados de unidades experimentales dentro de tratamientos⎯, cada grupo de nk unidades experimentales dentro del tratamiento k tienen una contribución que se expresa como:

( )( )

( )

SCUE trat Y Y Y Y

SCUE trat Y Y Y Y

SCUE trat t Y Y Y Y

X

X

Xt t

1

2

= −

= −

= −

' '

' '

' '

P P

P P

P P

T

T

T

1 1

2 2

M

Adicionando las t contribuciones anteriores de la variación de unidades experimentales dentro de tratamiento, se tiene que la suma de cuadrados del error experimental (SCEE) es:

SCEE Y Y Y Yk k

k

t

Xi

t=

⎛⎝⎜

⎞⎠⎟ −

⎛⎝⎜

⎞⎠⎟

= =∑ ∑' 'P PT

1 1 (24)

A continuación se desarrollan P PTk kXk

t

k

t y :

==∑∑

11de la expresión (24):

1) Basándose en la Definición 1, ( )P T T T TTk k k k k= ′ ′−1 y se tiene que:

( )′ =

⎢⎢⎢⎢

⎥⎥⎥⎥

′ =

⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥

−T T T Tk k

n n

k k

rr

r

r

r

rk k

0 00 0

0 0

1 0 0

0 1 0

0 0 1

1

L

L

M M M

L

L

L

M M M

L x

; ;

la matriz ( )T T Tk k k' −1

es:

Page 26: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

26

0 0 0 0 0 0 0 00 0 0 0 0 0 0 00 00 0 0 0 0 0 0 0

1 1 1

1 1 1

1 1 1

1

1

1 1

1

1

p q

p q

p q

p q nr n

gg

k

gg k

t

gg

k

k gg k

t

r r rr r r

r r r

p n r q n r nr n r n r n r

k

' '

' '

' '

' '

'

; .

− − −

− − −

− − −×

=

= + =

= +

⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥

= = = + +∑ ∑ ∑ ∑

L L L L

L L L L

M M M M M M M M M

L L L L

donde ;

Entonces:

P

O O O

O

J O O

O J O

O O J

O

O O O

Tk

r

r

r

r r r

r r r

r r r

nr nr

=

⎢⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥⎥

×

1

1

1

L

L

M M

L

Por lo tanto:

k

t

r r r

r r r

r r rnr nr

k

r

r

r

=

×

∑ =

⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥

1

1

1

1

P

J O O

O J O

O O J

T

L

L

M M M

Observe que k i

n

i

t

rk= =∑ ∑= ⎛

⎝⎜⎞⎠⎟=

1 1

12

P A PT C

( ) ( )2) Similarmente,

de donde

PX k k k k k k k k kk

kX X X X X X n r X X

n r= ′ = =

− −' ; ; ;' '1 1 1

como ( )X Xk k' −1 es un escalar, se puede reescribir PX k así:

PXk

k kk n rX X=

1 '

o equivalentemente,

Page 27: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

27

P

O O O O

O O J O

O O O

Xk

n r

nr nr

k kn r=

⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥ ×

L L

M M M M

L

M M M

L L

1,

por lo que:

k

t

X

n r

n r

tn r

nr nr

k

t

n r

n r

n r

=

×

∑ =

⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥

1

1

2

1

1

1

1

2P

J O O

O J O

O O J

L

L

M M M

L

;

observe quek

t

X k=∑ =

1P PT .

De esta manera, factorizando y sustituyendo en la expresión (24), la suma de cuadrados del error experimental puede replantearse así:

SCEE Y Y= −' ( )P PC T2 (25) Adicionando la SCtrat y la SCEE dada en (24), se tiene lo siguiente:

[ ]= − +⎡

⎣⎢

⎦⎥ −

⎣⎢

⎦⎥

⎣⎢

⎦⎥

= =∑ ∑Y Y Y P Y Y Y Y YCk

t

k

t

Xk k' ' ' 'P P PT T1

1 1

[ ] [ ]= − +⎡

⎣⎢

⎦⎥ −

⎣⎢

⎦⎥

=∑Y Y Y Y Y Y Y YCk

t

k' ' ' 'P P P PT T T1

1

=⎛⎝⎜

⎞⎠⎟ −

⎣⎢

⎦⎥

=∑Y Y Y Yk

t

Ck' '

11

P PT .

Si en la última expresión, se sustituye la matriz asociada a la forma cuadrática del primer término por PC2

, y se factoriza, se obtiene que:

( )SC UE Y YC( ) '= −P PC2 1

como, de hecho, se presentó en (14). Observe que si se adiciona la SCtrat en (23) y la SCEE en (25), se obtiene de forma directa el resultado anterior. Se ha escrito que, los grados de libertad asociados a una suma de cuadrados en forma cuadrática Y Y'A corresponden al ( ) ( )r trA A= , por ser A idempotente en estos casos. Así, la SCtrat tiene t −1 grados de libertad y la SCEE tiene n t− grados de libertad. 4.1. Esperanzas de las sumas de cuadrados

Page 28: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

28

Considerando el modelo lineal del diseño completamente aleatorio en (22) bajo los supuestos enumerados antes, se procederá a desarrollar las esperanzas de la SCtrat y la SCEE, haciendo uso de la expresión (17) sobre el cálculo de ( )E Y Y' A . 1. A continuación se muestra que, ( ) ( )[ ]E SCtrat E Y YC= −' P PT 1

( ) ( )[ ] ( ) ( ) ( ) tr= − + −P P P PT TC CVar Y E Y E Y1 1

'

( ) ( ) = − + −=∑

στ τ

2

1

21r

t r nk

t

k k (26)

donde τ τ==∑

11nnk k

k

t.

Ahora bien, ( ) ( ) ( )P T T T TTVar Y Var Y= −' '1 ; como la matriz ( )T T T' −1 se obtuvo en el desarrollo del PT , entonces sólo falta desarrollar:

( )T'

' ' '

' ' '

' ' '

Var Y

r

r

r

n r

n r

n rt nr

t

=

⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥

σ

σ

σ

2

2

2

1 0 0

0 1 0

0 0 1

1

2

L

L

M M M

x

Por lo que,

( )P

J O O

O J O

O O J

T

x

Var Yr

n r

n r

n r

n r

n r

tn r

nr nrt

=

⎢⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥⎥

1

2

12

2

2

1

2

σ

σ

σ

L

L

M M M

L

a) La traza de la matriz que antecede es:

( )( )tr PTVar Yr

t=σ 2

.

Como ( )E Y = Xτ , entonces, ( ) ( )E Y E Y' ' 'P X P XT T= τ τ . De acuerdo al Lema 1,

[ ] [ ] [ ]P X P T P P T P TT T T T T= = =C C C1 1 1 ; ya que el vector C1 puede expresarse como una combinación lineal de las columnas de T, puede escribirse que:

P P T TT TC Ct t1 11 1= = = ; entonces se tiene:

Page 29: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

29

[ ]P X T XT = =C1 . b) En consecuencia,

( ) ( ) ( )E Y E Y n rK

t

k k' ' 'P X XT = = +=∑τ τ

1

2μ τ .

c) Del desarrollo de (19) se sabe que:

( )( )tr PC Var Yr1

2=σ ,

d) y

( ) ( ) ( )[ ]E Y E Ynr nr

n rC nr k k' ' 'P X J X1

1 1 2= = +∑τ τ μ τ .

Por lo tanto:

( ) ( ) ( ) ( )[ ]E SCtratr

t n rnr

n rk

t

k k k k= − + + − +=∑ ∑

σ μ τ μ τ2

1

2 21 1

( ) ( ) ( ) = − + + − +⎡

⎣⎢

⎦⎥

⎣⎢⎢

⎦⎥⎥= =

∑ ∑σ μ τ μ τ

2

1

2

1

2

1 1r

t r nn

nk

t

k kk

t

k k ,

y factorizando, se obtiene la expresión (26). 2. Aplicando (17), se muestra que,

( ) ( )[ ]( ) ( )[ ] ( ) ( ) ( )

( )

E SCEE E Y Y

Var Y E Y E Y

rn t

= −

= − + −

= −

'

'

P P

P P P P

C T

C T C T

2

2 2

2

tr

σ

(27)

ya que,

a) De la verificación de (19), ( )[ ]tr PC2

2Var Y

rn=

σ

b) De la verificación de (26), ( )[ ]tr PTVar Yr

t=σ 2

c) Así también, de verificar (26), ( ) ( ) ( )E Y E Y n rk

t

k k' PT = +=∑

1

2μ τ

Entonces,

( ) ( )E Y E Y' ' 'P X P X X XC C2= = ′ ′τ τ τ τ

2

ya que aplicando el Lema 1, P X XC2= .

d) Finalmente, ( ) ( ) ( )E Y E Y n rk kk

t' PC2

2

1= +

=∑ μ τ ,

y usando los resultados de estos cuatro incisos se obtiene (27). Para completar la tabla de análisis de varianza, se usa ( ) ( )E SCEM n rm= −σ 2 1 , de la expresión (20).

Page 30: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

30

Tabla 4. Sumas de cuadrados y esperanzas de los cuadrados medios del diseño completamente aleatorio con submuestreo.

FV GL SC E(CM) Trat

t −1 ( )Y YC' P PT −1 ( )σ σ τ τεm k k

k

tr r

tn2 2 2

11+ +

−−

=∑

EE n t− ( )Y Y' P PC T2− σ σ εm r2 2+

EM nr n− ( )Y Ynr' I PC−2

σ m2

Total nr −1 ( )Y Ynr C' I P−1

Recuerde que σ σ σ ε

22 2

rrm= +

Page 31: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

31

5. DISEÑO DE BLOQUES COMPLETOS AL AZAR CON SUBMUESTREO El modelo original escrito en (2) transformado al diseño de bloques completos al azar queda como:

Y Bikj i k ik ikj= + + + +μ τ δ ε (28) en donde: Yikj : j-ésima observación del tratamiento k perteneciente al bloque i, i b=1 2, , , ,K k t=1 2, , , ,K j r=1 2, , , .K μ : efecto de la media Bi : efecto del bloque i τ k : efecto del tratamiento k δ ik : interacción del bloque i y el tratamiento k ε ikj: error muestral Los supuestos del modelo (28) son: a) ( )δ σ εik N~ ,0 2

b) ( )ε σikj mN~ ,0 2

c) ( )cov ,δ εik ikj = 0

El modelo (28) escrito en forma matricial es:

[ ]Y C BB T ik ikj=⎡

⎢⎢⎢

⎥⎥⎥

+ +1 X Xμ

τδ ε (29)

donde, Y es el vector de observaciones de orden nr x 1, donde n = bt; [ ]C B T1 X X es la matriz

diseño del diseño bloques completos al azar; [ ]μ τB ′ es el vector de parámetros; δ es el vector del error experimental y ε es el vector del error muestral. De esta forma, se presenta en (30) la suma de cuadrados total corregida (SCT) de este diseño.

( )SCT Y Ynr C= −' I P1

= + + +SCbloq SCtrat SCEE SCEM

( ) ( ) ( ) ( ) = − + − + − − + + −Y Y Y Y Y Y Y YB T B TC C C nr' ' ' 'P P P P P P P P I PX X C X X C1 1 2 1 2

(30)

5.1. Esperanzas de las sumas de cuadrados Siguiendo el mismo razonamiento presentado en las esperanzas de las sumas de cuadrados del diseño completamente aleatorio, se expondrán a continuación las que corresponden al diseño de bloques completos al azar.

[ ] [ ][ ]1. E SCbloq E Y YB C= −' P PX 1

Page 32: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

32

( ) ( )[ ] ( ) ( ) ( ) tr= − + −P P P PX XB BC CVar Y E Y E Y1 1

'

De la expresión anterior es necesario conocer: 1.a) La ( )[ ]tr PXB

Var Y ; desarrollándolo por pasos:

( )′ =

⎢⎢⎢⎢

⎥⎥⎥⎥

′ =

⎢⎢⎢⎢

⎥⎥⎥⎥

×

×

X X X XB B

b b

B B

b b

rtrt

rtrt

0 00 0

0 0

11 0 00 1 0

0 0 1

1

L

L

M M M

L

L

L

M M M

L

; ;

( )X X X P

J O OO J O

O O J

XB B B

rt rt rt

rt rt rt

rt rt rt rtb b

rt rt rt

rt rt rt

rt rt rt rtb rtb

rt rtB′ =

⎢⎢⎢⎢

⎥⎥⎥⎥

=

⎢⎢⎢⎢

⎥⎥⎥⎥

× ×

1 11 0 00 1 0

0 0 1

1L

L

M M M

L

L

L

M M M

L

; .

Una vez teniendo la expresión del proyector PX B, se postmultiplica por la ( )Var Y ,

( )P

J O O

O J O

O O J

X BVar Y

rt

r

r

r

rt rt rt

rt rt rt

rt rt rtrtb rtb

=

⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥

×

1

2

2

2

σ

σ

σ

L

L

M M M

L

De ahí, se obtiene que:

( )[ ]tr PX BVar Y

rrtbrt r

b= =σ σ2 2

.

1.b) Del desarrollo de (19) y sustituyendo nr por rtb se tiene:

( ) ( )P JC nrVar Yrtb

C C Var Yrtb r1

1 11 1

2= =' σ

,

y su traza es:

( )[ ]1.b) tr PC Var Yr rtb

rtbr1

2 21= =σ σ .

Considere que l Bik i k= + +μ τ y que el vector l tiene r elementos de cada lik . Entonces la ( )E Y l= . De esta forma, se escribe que:

( ) ( )1.c) E Y E Yrt

l X X lrt

r lB B B ik

k

t

i

b' ' 'PX = =

⎣⎢

⎦⎥

==∑∑

1 111

2

y

( ) ( )1.d) E Y E Yrtb

l lrtb

r lC rtb ikk

t

i

b' 'P J

1

1 111

2

= =⎡

⎣⎢

⎦⎥

==∑∑

Page 33: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

33

Por lo tanto:

( )[ ] ( )E Y Yr

brt

r lrtb

r lB C

i

bik

k

t

ikk

t

i

b' P PX − = − +

⎣⎢

⎦⎥ −

⎣⎢

⎦⎥= = ==

∑ ∑∑1

2

1 1

2

11

2

1 1 1σΣ

( ) ( ) = − + −⎡

⎣⎢

⎦⎥∑∑ ∑∑

==

σ 22

11

2

1r

b rt

l rbt

lik ikk

t

i

b

( ) ( ) = − + −=

σ 2

12 2

1r

b rt

t Bi Bi

donde, Bb

Bi

b

i==

11Σ ; obteniéndose que:

[ ] [ ][ ]E SCbloq E Y P P YX CB= −'

1

( ) ( ) = − + −=

σ 2

1

21

rb rt B B

i

biΣ (31)

2. Así también, [ ] [ ][ ]E SCtrat E Y Y

T C= −' P PX 1

( ) ( )[ ] ( ) ( ) ( ) tr= − + −P P P PX XT TC CVar Y E Y E Y1 1

'

( ) ( ) = − + −=∑

στ τ

22

11

rt rb k

k

t, (32)

donde,τ τ==∑

11t k

k

t. Para mayor claridad en la obtención de (32), se presentan a continuación el

desarrollo del proyector PXTy de ( )PXT

Var Y para conocer la ( )[ ]tr PXTVar Y y ( ) ( )E Y E Y

T' .PX Así,

( )P X X X XXT T T T T= ′ de donde,

( ) ( )′ =

⎢⎢⎢⎢

⎥⎥⎥⎥

′ =

⎢⎢⎢⎢

⎥⎥⎥⎥

−X X X XT T T T

rbrb

rbrb

0 00 0

0 0

11 0 00 1 0

0 0 1

1

L

L

M M M

L

L

L

M M M

L

; ;

( )X X XT T T

r r r r r r r r r

r r r r r r r r r

r r r r r r r r r

′ =

⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥

′1 0 0 1 0 0 1 0 00 1 0 0 1 0 0 1 0

0 0 1 0 0 1 0 0 1

' ' ' ' ' ' ' ' '

' ' ' ' ' ' ' ' '

' ' ' ' ' ' ' ' '

L L L L

L L L L

M M M M M M M M M

L L L L

;

Page 34: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

34

P

J O O J O O J O OO J O O J O O J O

O O J O O J O O JJ O O J O O J O OO J O O J O O J O

O O J O O J O O J

J O O J O O J

XT rb

r r r r r r r r r

r r r r r r r r r

r r r r r r r r r

r r r r r r r r r

r r r r r r r r r

r r r r r r r r r

r r r r r r

=1

L L L L

L L L L

M M M M M M M M M

L L L L

L L L L

L L L L

M M M M M M M M M

L L L L

M M M M M M M M M

L L L r r r

r r r r r r r r r

r r r r r r r r r rtb rtb

O OO J O O J O O J O

O O J O O J O O J

L

L L L L

M M M M M M M M M

L L L L

⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥ ×

De ahí que,

( )P

J O O J O O J O OO J O O J O O J O

O O J O O J O O JJ O O J O O J O OO J O O J O O J O

O O J O O J O O J

J O O J O

XTVar Y

r rb

r r r r r r r r r

r r r r r r r r r

r r r r r r r r r

r r r r r r r r r

r r r r r r r r r

r r r r r r r r r

r r r r r

=σ 2 1

L L L L

L L L L

M M M M M M M M M

L L L L

L L L L

L L L L

M M M M M M M M M

L L L L

M M M M M M M M M

L L L L

L L L L

M M M M M M M M M

L L L L

O J O OO J O O J O O J O

O O J O O J O O J

r r r r

r r r r r r r r r

r r r r r r r r r rtb rtb

⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥ ×

2.a) Entonces,

( )[ ]tr PXTVar Y

rb rrtb

rt= =

1 2 2σ σ ,

2.b) y

( ) ( )E Y E Yrb

l lrb

r lT T T

i

b

ikk

t' 'P X XX = ′ =

⎣⎢

⎦⎥

==∑∑

1 11

2

1

Por lo tanto:

( ) ( )E SCtratr

trb

r lrtb

r lk

t

i

b

ikk

t

iki

b= − +

⎣⎢

⎦⎥ −

⎣⎢

⎦⎥

= = ==∑ ∑ ∑∑

σ 2

1 1

2

11

2

1 1 1

Page 35: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

35

( ) = − +⎡

⎣⎢

⎦⎥ −

⎣⎢

⎦⎥

= = = =∑ ∑ ∑ ∑

σ 2

1 1

2

1 1

2

1r

t rb

tl r

tbl

k i

b

iki

b

k

t

ik

( ) = − +⎡

⎣⎢

⎦⎥ −

⎣⎢

⎦⎥

⎣⎢⎢

⎦⎥⎥= = = =

∑ ∑ ∑ ∑σ 2

1 1

2

1 1

2

1 1r

t rb

lt

lk

t

i

b

iki

b

k

t

ik

( ) ( ) = − + −=∑

στ τ

2

1

2 21r

t rb

bk

t

k

( ) ( ) = − + −=∑

στ τ

22

11

rt rb k

k

t,

como se presentó en (32). 3. Para obtener la esperanza del tercer término de (30) ⎯es decir, la esperanza de la SCEE⎯, primero se va a desarrollar la [ ]E SC UE( ) :

3.a) ( )[ ] ( )[ ]E SC UE E Y YC= −' P PC2 1

( ) ( )[ ] ( ) ( ) ( ) tr = − + −P P P PC C2 1 2 1C CVar Y E Y E Y'

De 3.a) hay que conocer,

a.1) ( )[ ] ( )tr tr P C CC2

1 12 2

2 2Var Y

rVar Y

r rrtb

rbt= ′⎡

⎣⎢⎤⎦⎥= =

σ σ ,

ya que,

( )P

J O OO J O

O O J

C2

1 2Var Y

r r

r r r

r r r

r r r rtb rtb

=

⎢⎢⎢⎢

⎥⎥⎥⎥

×

σL

L

M M M

L

a.2) ( ) ( )E Y E Yr

l lr

r l r lik ikk

t

i

b

k

t

i

b' P C CC2

1 12 2

2 2 2

1111= ′ ′ = =

====∑∑∑∑ .

Por lo tanto: ( )[ ] ( )[ ]E SC UE E Y YC= −' P PC2 1

( ) ( ) = − + −⎡⎣⎢

⎤⎦⎥

∑∑∑∑σ 2

2 21 1r

bt r lbt

lik ik

( ) [ ][ ]= − + + + − + +∑∑σ μ τ μ τ

2 21

rbt r B Bi k

( ) ( ) ( )[ ]= − + − + −==∑∑

σ τ τ2

11

2

1r

bt r B Bi kk

t

i

b (33)

3b) Considerando que en el diseño de bloques completos al azar, se cumple que SC UE SCbloq SCtrat SCEE( ) = + + se procederá a obtener la [ ]E SCEE de la expresión (34) como sigue: [ ] [ ][ ]E SCEE E Y Y

B T C= − − +' P P P PC X X2 1

Page 36: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

36

( ) ( ) ( )[ ][ ] ,= − − − − −E Y YB TC C' P P P P P PC C X X2 1 1 1

sustituyendo en la expresión anterior los resultados de (31), (32) y (33) se tiene que:

( ) ( ) ( )[ ] ( ) ( )[ ] ( ) ( )= − − − − − + − + − − − − −== ==∑∑ ∑∑

σ τ τ τ τ2 2

11

2 2

111 1 1

rbt b t r B B rt B B rbi k

k

t

i

b

i kk

t

i

b

( )( ) ( )( )= − − + − −∑∑σ

τ τ2

1 1 2r

b t r B Bi k

obteniéndose finalmente,

( )( )E SCEEr

b t( ) = − −σ 2

1 1 , (34)

ya que, ( )( )B Bi kk

t

i

b− − =

==∑∑ τ τ 0

11.

4. Por último, haciendo uso de la expresión (17) sobre el cálculo de ( )E Y Y' A , se presenta la

[ ]E SCEM así:

[ ] ( )[ ]E SCEM E Y Yrtb= −' I PC2

( ) ( )[ ] ( ) ( ) ( ) tr= − + −I P I PC Crtb rtbVar Y E Y E Y2 2

'

De la expresión anterior, se requiere lo siguiente: 4.a) A partir de (20) y sustituyendo n por tb se tiene que,

( )[ ] ( )tr Irtb mVar Y rtb= +2 2σ σε

4.b) A partir de (19) y sustituyendo n por tb,

( )[ ]tr PC2

2Var Y

rtb=

σ

4.c) Se tiene también que:

( ) ( ) ( ) ( )E Y E Y E Y E Y rrtbk

t

iki

bl' 'I = =

==∑∑

1

2

1

4d) y

( ) ( )E Y E Y rk

t

iki

bl' PC2

1

2

1=

==∑∑

Por lo tanto,

( ) ( )E SCEM rtbr

tbm= + −σ σσ

ε2 2

2

( ) ( ) = + − +σ σ σ σε εm mrtb r tb2 2 2 2

( ) = −tb rmσ 2 1 Obsérvese que la expresión inmediata anterior es equivalente a la que se presentó en (20), para el diseño basado en las unidades experimentales y para el diseño completamente aleatorio. Aplicando la Definición 3, los grados de libertad de las SCtrat, SCbloq, SC(UE), SCEE y SCEM son:

Page 37: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

37

( ) ( )tr rP P P PX XT TC C t− = − = −1 1

1 ,

( ) ( )tr r ,P P P PX XB BC C b− = − = −1 1

1

( ) ( )tr r ,P P P PC C2 1 2 11− = − = −C C tb

( ) ( ) ( )( )tr r ,P P P P P P P PC X X C X X2 1 2 11 1 1− − + = − − + = − − + = − −

B T B TC C bt b t b t

( ) ( ) ( )tr r ,I P I PC Crtb rtb rtb bt tb r− = − = − = −2 2

1

respectivamente. Finalmente, los resultados del diseño de bloques completos al azar con submuestreo, se resumen en el siguiente cuadro.

Tabla 5. Suma de cuadrados y esperanzas de los cuadrados medios del diseño de bloques completos al azar con submuestreo.

FV GL SC E(CM)

bloq b−1 [ ]Y YB C' P PX −

1 ( )σ 2 2

11rrt

bB Bi

i

b+

−−

=∑

trat t −1 [ ]Y YT C' P PX −

1 ( )σ

τ τ2

2

11rrb

t kk

t+

−−

=∑

EE ( )( )b t− −1 1 [ ]Y YB T C' P P P PC X X2 1

− − − σ σσ

εm rr

2 22

+ =

EM ( )bt r −1 [ ]Y Yrtb' I PC−2

σm2

Total rtb −1 [ ]Y Yrtb C' I P−1

Page 38: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

38

6. DISEÑO GENERAL CON EL MISMO NÚMERO DE SUBMUESTRAS POR UNIDAD EXPERIMENTAL

Se han desarrollado en los capítulos precedentes, las sumas de cuadrados y las esperanzas de los cuadrados medios, de las fuentes de variación correspondientes al diseño abordado. En este Capítulo se expone el planteamiento general, para obtener resultados de cualquier diseño experimental planeado con igual número de submuestras por unidad experimental. La exposición se hará en dos pasos: primero se presenta el análisis directamente sobre las observaciones originales

Yij y luego, se realiza el análisis sobre las variables Yri. , donde Y Yi ij

j

r

. ==∑

1. Sin embargo, antes de

continuar es indispensable conocer los siguientes hechos: a) Para cualquier matriz diseño X con n unidades experimentales y r submuestras en cada una de

ellas, existe una matriz A tal que: X C A

nr k nr n n kx x x= 2 (35)

donde C2 es la matriz basada en las unidades experimentales y k, es definida por las columnas del diseño. Por ejemplo, en el diseño completamente aleatorio k t= +1,

( )

A =

⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥ +

1 1 0 01 0 1 0

1 0 0 1

1 1 1 1

2 2 2 2

1

n n n n

n n n n

n n n n n tt t t t

L

L

M M M M

L x

donde n es el número total de unidades experimentales, t el número de tratamientos, nk el número

de repeticiones del tratamiento k, r el número de submuestras y n nkk

t=

=∑

1 . Note con cuidado que la

estructura de A es idéntica a la de X, sólo que cada hilera de A, aparece r veces en X. Ejemplificando en el diseño de bloques completos al azar, k b t= + +1 y

( )

A

II

I

=

⎢⎢⎢⎢

⎥⎥⎥⎥

+ +

1 1 0 01 0 1 0

1 0 0 11

t t t t t

t t t t t

t t t t t bt b t

L

L

M M M M M

L x

donde I t es una matriz idéntica de orden t x t y n bt= . Observe de nuevo que, A sólo contiene una hilera de cada r repeticiones que tiene X de esa hilera, de modo que la estructura del diseño experimental es la misma en ambas matrices. b)

′ = ⇔ ′ =C C I C C In2 2 2 21rrn (36)

c) Usando (36) se tiene que:

Page 39: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

39

( ) ( ) ( ) ( ) ( )r r r r r rX C A A C C A C A X= ≤ = ′⎡⎣⎢

⎤⎦⎥≤ =2 2 2 2

1r

(37)

d) La ( )Var Y que se presentó en (18) puede reescribirse como:

( )Var Y m nr= ′ +σ σε2

2 22C C I (38)

e) A partir del resultado B B O B O' = ⇔ = en donde B es una matriz, se escriben los siguientes resultados sobre la inversa generalizada de X'X, es decir, sobre ( )X X' − :

e.1) ( ) ( )X X X X X X X X X X' ' ' ''− −= , ya que:

( ) ( )X X X X X X X X X X X X O' ' ' ' ' ''− −− = . Observe que,

( ) ( )X X X X X X X X X X X X X X' ' ' ' ' ' ''− −= =

( ) ( )[ ]X X X X X X X X X X X O' ' ' ' ''− −− =

( ) ( )[ ] ( ) ( )[ ]X X X X X X X X X X X X X X X X X X X O' ' ' ' ' ' ' ' '' '− − − −− − =

Por lo tanto:

( ) ( )[ ]X X X X X X X X X X' ' ' '− −=′

.

Además, e.2) ( ) ( )X X X X X X X X' ' ' ''− −= ya que

( ) ( )X X X X X X X X X X O' ' ' ''− −− =

( ) ( )[ ] ( ) ( )[ ]X X X X X X X X X X X X X X X O' ' ' ' ' ' ' '' '− − − −− − = .

Por lo tanto:

( ) ( )[ ]X X X X X X X X' ' ' '− −=′

.

Por último, e.3) ( ) ( )X X X X X X X X' ' ' '1 2

− −= (39) ya que,

( ) ( )X X X X X X X X X X X X O' ' ' ' ' '1 2− −− =

( ) ( )[ ] ( ) ( )[ ]X X X X X X X X X X X X X X X X X X X O' ' ' ' ' ' ' ' ' '1 2 1 2− − − −− − =

Por lo que,

( ) ( )X X X X X X X X X X' ' ' ' ' '1 2− −= ,

entonces: ( ) ( )[ ]X X X X X X X X X O' ' ' ' '1 2

− −− =

( ) ( )[ ] ( ) ( )[ ]X X X X X X X X X X X X X X X O' ' ' ' ' ' '1 2 1 2− − − −− − =

Page 40: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

40

Por lo tanto:

( ) ( )X X X X X X X X' ' ' '1 2− −=

como en la expresión (39). 6.1. Diseño general sobre las observaciones originales Yij El modelo lineal del diseño general propuesto es el siguiente:

( )Y dij i i ij= + + +μ τ δ ε (40)

con ( ) ( ) ( )δ σ ε σ δ εεi ij m i ij~ , , ~ , cov ,0 0 02 2, y ,=

en donde μ es el efecto de la media que es común a todas las unidades experimentales, ( )τ i d es el efecto asociado a la unidad experimental i según el diseño y es la que conformará la matriz diseño X en correspondencia a las fuentes de variación a las que esté asociada esta unidad, δi corresponde al efecto aleatorio de la i-ésima unidad experimental (error experimental) y εij es el efecto aleatorio de la j-ésima observación dentro de la unidad experimental i (error muestral ); Yij es la variable respuesta que es explicada por las fuentes de variación descritas en el lado derecho de (40). El modelo lineal del diseño general, presentado en matrices es:

Y = + +Xγ δ ε (41) en donde Y es el vector de observaciones Yij de orden nr x 1, X es la matriz nr x k del diseño general (ver 35), γ es el vector de parámetros de orden k x 1 asociados al diseño, δ es el vector del error experimental y ε el vector del error muestral. La suma de cuadrados total (SCT) en el diseño general ⎯sobre las observacioes Yij ⎯ es: SCT SCModelo SCEE SCEM= + +

[ ] [ ] [ ] [ ]Y Y Y Y Y Y Y Ynr nrnr nr' ' ' 'I P P P P P I PX C X C− = − + − + −1 1 2 2

(42)

De la expresión (20), se sabe que:

( ) ( )[ ] ( )E SCEM E Y Y n rnr m= − = −' I PC22 1σ .

Ahora se desarrollará la esperanza de la SCEE que se presenta en (43). Aplicando (17),

[ ] ( )[ ]E SCEE E Y Y= −' P PC X2 y se tiene:

[ ] ( )[ ] ( ) ( ) ( ) ( )E SCEE Var Y E Y E Y= − + −tr P P P PC X C X2 2'

De esta última expresión es importante conocer que, a) ( )[ ] [ ][ ] [ ]tr tr trP P C C I C CC C2 2 2 2

2 2 22 2

2Var Y nm nr m= + = +' 'σ σ σ σε ε

= + =nr n nrmσ σ σ

ε2 2

2

b) ( ) ( )E Y E Y' ' ' ' ' ' ' ' 'P X P X A C P C A A C C AC C C2 2 22 2 2 2= = =γ γ γ γ γ γ

Page 41: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

41

= γ γ' 'X X

c) ( )[ ] [ ][ ]tr trP P C C IX XVar Y m nr= ′ +σ σε2

2 22

[ ] ( ) tr r= ′ +σ σε2

2 22P C C XX m

donde r(X) denota el rango de la matriz X.

La [ ] [ ] ( )[ ]tr tr trP C C C P C C X X X X CX X2 2 2 2 2 2′ = = ′ −' ' '

( )[ ] tr= ′ ′ ′ ′ ′−C C A A C C A A C C2 2 2 2 2 2

( )[ ] ( )[ ] tr = tr = ′ ′ ′ ′− −r r r2A A A A A A A A

( ) ( )[ ] ( )[ ] tr r r= = =r r rP A XA Por lo tanto:

( )[ ] ( ) ( ) ( )tr r r rPXVar Y r X Xr

Xm= + =σ σ σε2 2

2

d) ( ) ( )E Y E Y' ' ' ' 'P X P X X XX X= =γ γ γ γ De esta forma la esperanza de la SCEE:

[ ] ( )[ ]E SCEEr

n= −σ 2

r X (43)

Por último, usando los resultados de los incisos c) y d) anteriores y el de [ ]E Y Ynr

' P1 obtenido para

presentar (19) pero considerando que ahora ( )E Y = Xγ , se tiene que [ ]E SCModelo es:

[ ] ( )[ ]E SCModelo E Y Ynr

= −' P PX 1

( )[ ] r= − + −σ 2

1 1r nr nrX X X X J Xγ γ γ γ' ' ' ' (44)

Puede apreciarse que adicionando SCModelo y SCEE se obtiene la SC(UE) que se presentó en la expresión (14) de la Sección 3.2.1.

[ ] [ ] [ ]Y Y Y Y Y Ynr nr

' ' 'P P P P P PX C X C− + − = −1 12 2

A continuación, se resumen los resultados del diseño general que se desarrollaron.

Tabla 6. Sumas de cuadrados y esperanzas de los cuadrados medios del diseño general con submuestreo sobre Yij .

FV GL SC E(CM)

Modelo ( )r X −1 ( )Y Ynr

' P PX − 1 ( )σ 2 1

11

r nrnr nr+−

−⎡⎣⎢

⎤⎦⎥r

X

X I J Xγ γ' '

EE ( )n − r X ( )Y Y' P PC X2−

σ 2

r

Page 42: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

42

FV GL SC E(CM)

EM ( )n r −1 ( )Y Ynr' I PC−2

σ m2

Total nr −1 ( )Y Ynr nr' I P− 1

como siempre σ σ σ ε

22 2

rrm= +

6.2. Diseño general sobre las variables Yri.

A continuación se muestra que las sumas de cuadrados del diseño general sobre las observaciones Yij lo son también del diseño correspondiente a las unidades experimentales sobre las

variables Yri. :

Primero, observe que:

( )Y Y Y Yr

Y Yr

Z Z Zr

Zr

' ' 'P C C C C C CC2 2 2 21

2 2 21 1

= ′ ′ ′ = ′ = =⎡

⎣⎢

⎦⎥

′⎡

⎣⎢

⎦⎥

donde,

Z Y

YY

Yn

= ′ =

⎢⎢⎢⎢

⎥⎥⎥⎥

C

.

.

.

2

1

2

M.

Por otro lado:

[ ]Y Y Y C C C C Ynr

Y Cnr

Ynr ij

j

r

i

n' ' 'P1 1 1 1

11 1

2

11

21 1

= ′⎛⎝⎜

⎞⎠⎟

′ = =⎡

⎣⎢⎢

⎦⎥⎥

==∑∑

[ ]= =⎡

⎣⎢⎤

⎦⎥=

⎣⎢⎤

⎦⎥⎡

⎣⎢

⎦⎥∑ ∑1 1 1 12

2 2

nrY

nYr n

Zri

in.

. '

[ ]=⎡

⎣⎢

⎦⎥

⎣⎢

⎦⎥ =

⎣⎢

⎦⎥

⎣⎢

⎦⎥

−1 1 1 1 11

nZr

Zr

Zr

Zrn n n n

' '' 'J

= ⎡

⎣⎢

⎦⎥

′⎡

⎣⎢

⎦⎥

Zr

Zrn

P1 .

De tal forma que, se puede escribir la siguiente identidad:

[ ] [ ]Y Y Zr

Zrnr nn'

'

P P I PC2 1 1− = ⎡

⎣⎢⎤

⎦⎥− ⎡

⎣⎢⎤

⎦⎥, (45)

Page 43: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

43

que se puede interpretar diciendo: “la SC(UE) obtenida sobre las observaciones originales Yij es

igual a la SCT obtenida sobre las nuevas variables Yri. ”.

Además, conociendo que:

( )Y Y Y Y' ' ' ''P X X X XX = − ; usando (35) y e.2),

( )= ′−Y Y' ' ' 'C A A C C A A C2 2 2 2 ; usando que Z Y= ′C2 y de (36) que ′ =C C I2 2 r n ,

( )= −Z r Z' ' 'A A A A ; como r es un escalar,

( )= −1r

Z Z' ' 'A A A A

= ⎡⎣⎢

⎦⎥⎡

⎣⎢⎤

⎦⎥Zr

Zr

'

PA ;

se muestra que:

( ) [ ]Y Y Zr

Zrn'

'

P P I PC X A2− =

⎣⎢

⎦⎥ −

⎣⎢

⎦⎥ (46)

y que:

( ) [ ]Y Y Zr

Zrnr n

''

P P P PX A− =⎡

⎣⎢

⎦⎥ −

⎣⎢

⎦⎥1 1 . (47)

Con el desarrollo de (45), (46) y (47) se ha exhibido que la relación

( ) ( ) ( )Y Y Y Y Y Ynr nr

' ' 'P P P P P PC X C X2 21 1− = − + −

es equivalente a

[ ] [ ] [ ]Zr

Zr

Zr

Zr

Zr

Zrn nn n

⎣⎢⎤

⎦⎥

′− ⎡

⎣⎢⎤

⎦⎥= ⎡

⎣⎢⎤

⎦⎥− ⎡

⎣⎢⎤

⎦⎥+ ⎡

⎣⎢⎤

⎦⎥− ⎡

⎣⎢⎤

⎦⎥I P P P I PA A1 1

' '

. (48)

Este último análisis de varianza ⎯el de la expresión (48)⎯ corresponde a un diseño donde la

matriz del mismo es A y el vector de respuestas es Zr

⎣⎢

⎦⎥ . Es claro que la matriz A, corresponde a la

matriz diseño de las unidades experimentales, así como X es la matriz diseño de las observaciones

originales. Como se ha mencionado, los elementos del vector Zr

⎣⎢

⎦⎥ ⎯de dimensión n ×1⎯ son

Yri.⎡

⎣⎢

⎦⎥ (los totales de unidad experimental entre la raíz cuadrada del número de submuestras), de

manera que, a las unidades experimentales se les asigna este último valor en el análisis de varianza al que se está haciendo referencia. En el modelo (41), se tiene que Y = + +Xγ δ ε ; puesto que, X C A= 2 , se puede multiplicar a

(41) por ′C2 en ambos lados quedando como:

Page 44: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

44

′ = ′ + ′ + ′C C C A C C2 2 2 2 2Y γ δ ε Z r= + ′ + ′ A C Cγ δ ε2 2

lo cual es equivalente a escribir,

[ ]Zr

rr r

= + ′ + ′A C C γ δ ε1 1

2 2 , (49)

que es el modelo lineal sobre los valores Yri. de las unidades experimentales.

Observe que

[ ]Varr r

Varr

1 1 12 2 2′ + ′

⎣⎢

⎦⎥ = ′ +

⎣⎢

⎦⎥C C Cδ ε δ ε

[ ] ( ) = = ⎡

⎣⎢⎤

⎦⎥⎡

⎣⎢

⎦⎥Var

rY Var

rZ1 1

2C ' .

Por lo tanto:

( )Varr

Z Varr

Yr

Var Y1 1 12 2 2

⎣⎢

⎦⎥ = ′

⎣⎢

⎦⎥ = ′ ′C C C ; usando (38),

[ ]= ′ ′ +1

22

2 22

2r m nrC C C I Cσ σε

[ ]= +1 2 2 2

rr rn m nσ σε I I

[ ] [ ]= + = +1 2 2 2 2 2

rr r rm n m nσ σ σ σε εI I

= σ 2

r nI

Además:

Er r

1 1 02 2′ + ′⎡

⎣⎢

⎦⎥ =C Cδ ε

Entonces, si se hace, [ ]wr

= +1

2C ' δ ε , puede reescribirse (49) como:

( )Zr

r w= +A γ (50)

donde ( )E w = 0 y ( )Var wr n=σ2

I ; el análisis de (48), corresponde al modelo (50).

Para escribir el análisis de varianza de (48), sólo resta desarrollar γ γ' 'X I J Xnr nrnr−⎡

⎣⎢⎤⎦⎥

1 en

términos de la matriz diseño A, de las unidades experimentales. Esto se escribe enseguida:

γ γ γ γ' ' ' ' 'X I J X A C I J C Anr nr nr nrnr nr−⎡

⎣⎢⎤⎦⎥

= −⎡⎣⎢

⎤⎦⎥

1 12 2

Page 45: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

45

= −⎡

⎣⎢⎢

⎦⎥⎥

γ γ' 'A I J Ar rnrnr n

2

( ) ( ) = −⎡⎣⎢

⎤⎦⎥

rn

rnr nγ γ' 'A I J A1 .

Entonces la tabla de análisis de varianza para el modelo (48), es decir, sobre las variables Yri.

es:

Tabla 7. Sumas de cuadrados y esperanzas de los cuadrados medios del diseño

general sobre las variables Y

ri. .

FV GL SC E(CM)

Modelo ( )r A −1 ( )Zr

Zrn

⎣⎢

⎦⎥ −

⎣⎢

⎦⎥

'PA P1

( ) ( ) ( )σ 2 1

11

r Ar

nrn n+

−−⎡

⎣⎢⎤⎦⎥r

γ γ' 'A I J A

EE ( )n − r A ( )Zr n

Zr

⎣⎢

⎦⎥ −

⎣⎢

⎦⎥

'I PA

σ σ εm r2 2+

Total n −1 ( )Zr

Zrn n

⎣⎢⎤

⎦⎥− ⎡

⎣⎢⎤

⎦⎥

'

I P1

Puede observarse que a partir de las Tablas 3 y 7 puede construirse la Tabla 6 del modelo general; se toman las primeras dos hileras de la Tabla 7 y las últimas dos de la Tabla 3 para colocarlas en el orden descrito y obtener así la Tabla 6. 6.3. Aspectos metodológicos de la teoría general El resumen de los resultados del diseño general propuesto, se puede observar en las Tablas 6 y 7; en el Análisis de Varianza de la Tabla 6 se utilizan las observaciones originales Yij y se puede ver que, la SCT es particionada en la SC(UE) y la SCEM tal como en la expresión (1). Obsérvese que adicionando (43) y (44) se obtiene la SC(UE). Ahora bien, para particionar la SC(UE) en las

fuentes de variación del diseño correspondiente, será necesario analizar las variables Yri. y el

Análisis de Varianza se presenta en la Tabla 7. Observe que la SCT en la Tabla 7 puede considerarse "ficticia" ya que corresponde al valor de la SC(UE) que se obtiene con los datos originales Yij . En algunos experimentos con submuestreo, particularmente en la Genética1 , en donde es necesario considerar componentes de varianza, es importantísimo seguir estrictamente lo que se ha explicado sobre las Tablas 6 y 7, en el párrafo anterior. En cambio, si la intención del experimentador es solamente probar hipótesis de tratamientos, será suficiente con utilizar el

1 Dr. Ángel Martínez Garza. 1993. Montecillo, Edo. de México, Colegio de Postgraduados. (Comunicación personal).

Page 46: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

46

Análisis de Varianza de la Tabla 7. Otro aspecto relevante, es que al analizar las variables Yri. o

alguno de sus múltiplos, como el valor promedio de las submuestras por parcela Yi. , no se alterarán los valores de las F calculadas para las pruebas de hipótesis de los tratamientos; sin embargo, las

sumas de cuadrados que se obtendrán con datos diferentes a Yri. , no serán las correctas.

Particularmente, cuando se usa Y i. en lugar de Yri. , las sumas de cuadrados y los cuadrados medios

resultantes son r veces más pequeños con respecto a los valores correctos.

Page 47: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

47

7. UN ALGORITMO GENERAL PARA DISEÑOS EXPERIMENTALES CON SUBMUESTREO En este Capítulo se presenta un algoritmo útil para resolver cualquier diseño planeado con igual número de submuestras por unidad experimental, y es válido aún en los casos en los que resulte complicado conocer las componentes del error experimental. Este algoritmo se ha derivado de la teoría que se presenta en el planteamiento del diseño general (Capítulo 6), pero no se requieren leer todos los capítulos anteriores para entenderlo y estar en posición de resolver un problema particular con submuestreo, a menos que, se desee comprender los fundamentos de este tema. Por último, se desarrollan tres ejemplos con datos reales y se escriben los programas de SAS (Statistical Analysis System) para resolverlos en la microcomputadora. El algoritmo Suponer que en un experimento con n unidades experimentales se toman r submuestras (mediciones) de la variable-respuesta en cada; entonces habrán rn observaciones en total. Denotar como Yij a la j-ésima submuestra de la i-ésima unidad experimental, i n=1, ,K , j r=1, ,K . Para resolver cualquier diseño experimental con igual número de submuestras por unidad experimental, pueden seguirse estos tres pasos: PASO 1. Se ajusta un modelo basado en las unidades experimentales ⎯puede ver modelo (2) ó (10) ⎯ para obtener la suma de cuadrados total (SCT), la suma de cuadrados de las unidades (SC(UE)) y la suma de cuadrados del error muestral (SCEM). En este paso se usarán los datos originales Yij como variable respuesta, i n=1 2, , ,K , j r=1 2, , ,K . Las sumas de cuadrados se calculan con:

( )SCT Y Yj

rij

i

n= −

==∑∑

1

2

1..

( ) ( )SC UE r Y Yii

n= −

=∑ . ..

2

1

( )SCEM Y Yj

rij i

i

n= −

==∑∑

1

2

1.

Estas fórmulas se escribieron en las expresiones (4), (5) y (6), respectivamente, del Capítulo 3; ahí puede ver también un ejemplo numérico del cálculo de estas sumas de cuadrados con los datos de la Tabla 1. Observe que en este primer paso del algoritmo, sólo se requiere saber en qué unidad experimental se registró cada submuestra; no hace falta saber si la observación pertenece a tal bloque, o recibió el tratamiento fulano, o se obtuvo en la intersección de una hilera y una columna específicos, etc.

PASO 2. Enseguida se ajusta otro modelo que usa como variable respuesta a las Yri. (total de la i-

ésima unidad experimental entre la raíz cuadrada del número de submuestras) ⎯puede ver el modelo en (49)⎯, para particionar a la SC(UE), obtenida en el paso anterior, en las sumas de cuadrados de las fuentes de variación correspondientes a un diseño experimental particular: por ejemplo, en el diseño completamente al azar, la partición de la SC(UE) se hace en la suma de cuadrados de tratamientos (SCtrat) y la suma de cuadrados del error experimental (SCEE); en el diseño de bloques completos al azar, la partición de la SC(UE) se hace en la suma de cuadrados de bloques (SCbloq), la SCtrat y la SCEE.

Page 48: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

48

En este segundo paso, los valores Yir. son los que se asignan a las unidades experimentales para

el análisis de varianza ⎯como si fueran los datos observados en las mismas, en condiciones de un diseño estándar (o sea, sin submuestreo)⎯ y para ello, se hace uso de las fórmulas reportadas en la literatura dependiendo del diseño de donde provengan los datos. Para que esta explicación resulte más clara, pensemos por el momento, que estamos en el caso de un diseño completamente al azar con submuestreo ⎯suponiendo que las sumas de cuadrados del

primer paso ya fueron obtenidas⎯ y renombremos a Yr

Xikh

. = como la h-ésima repetición del k-

ésimo tratamiento, con k t=1, ,K , h nk=1, ,K . Observe que ¡ahora sí!, a diferencia del Paso 1, es indispensable saber qué tratamiento se le asignó ⎯aleatoriamente⎯ a cada unidad en el experimento. Hechas estas aclaraciones, entonces la SCT sobre las nuevas variables Xkh se calcula con:

( )SCT X Xkhh

n

k

t k= −

==∑∑ ..

2

11;

y la partición de las SC(UE) del primer paso, se obtiene calculando las siguientes sumas de cuadrados:

SCtratX

nXn

kk

t

k= −=∑ .

..

2

12

,

SCEE SCT SCtrat= − .

En estas fórmulas, nk es el número de repeticiones del k-ésimo tratamiento y n nkk

t=

=∑

1. La SCT

sobre las Xkh es igual a la SC(UE) sobre las observaciones Yij que se calculó en el Paso 1. ¿Qué situación se presenta si el diseño de donde provienen los datos experimentales es un bloques

al azar con submuestreo? Bueno, pues de manera similar, podemos renombrar a las Yr

Xikh

. = ,

haciendo que sea éste el valor que se asigna a la unidad experimental del h-ésimo bloque que recibió el k-ésimo tratamiento, con k t=1, , ,K h b=1, ,K . La SCT sobre las nuevas variables Xkh es:

( )SCT X Xkhh

b

k

t= −

==∑∑ ..

2

11.

Para particionar la SC(UE) obtenida con el Paso 1, en las sumas de cuadrados de las fuentes de variación correspondientes a un bloques al azar, se calculan:

SCbloqX

tXtb

h

b

= −=∑ .h

..

2

12

Page 49: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

49

SCtratX

bXtb

kk

t

= −=∑ .

..

2

12

SCEE SCT SCbloq SCtrat= − − De manera análoga, esta explicación se puede extender a otros diseños. Es conveniente reiterar, que la SCT que se obtenga en el Paso 2 corresponde en realidad al valor de la SC(UE) que se obtuvo en el Paso 1, ya que precisamente, se trata de particionar esta última suma de cuadrados en sus fuentes de variación correspondientes al diseño experimental particular. PASO 3. En los dos primeros pasos, se obtienen los valores de las sumas de cuadrados. Ahora sólo falta ordenarlos, tomando las sumas de cuadrados en que se particionó la SC(UE) en el segundo paso y la SCEM y la SCT obtenidos en el primer paso para que la Tabla de Análisis de Varianza (ANOVA) de su diseño con submuestreo quede completa. A continuación se presentarán tres ejemplos de casos reales que son resueltos con programas en SAS que se generaron siguiendo los tres pasos de este algoritmo. 7.1. Ejemplo del diseño completamente aleatorio con submuestreo En la Tabla 8 se reportan los datos de hinchamiento de un experimento realizado en tableros de aglomerado empleando un diseño completamente al azar. Se aplicaron cuatro tratamiento (A, B, C y D) con dos repeticiones y se registraron nueve observaciones (o submuestras) por unidad experimental. Para este ejemplo, los tratamientos consistieron en probar combinaciones de temperatura y tiempo en el proceso de prensado de los tableros; las unidades experimentales son los tableros de aglomerado que se remojaron en agua durante dos horas para estudiar su respuesta de hinchamiento en relación a su dimensión original. La medición de la variable respuesta (el hinchamiento), se realizó en submuestras denominadas para este caso, probetas ⎯que son subdivisiones del tablero.

Tratamiento Temperatura en °C Tiempo de prensado A 150 6.0 minutos B 150 8.5 minutos C 220 6.0 minutos D 220 3.5 minutos

Tabla 8. Porcentaje de hinchamiento de tableros remojados durante dos horas. Tratamientos

A B C D UE 1 UE 2 UE 3 UE 4 UE 5 UE 6 UE 7 UE 8 42.98 46.25 32.59 31.84 21.87 21.08 41.49 40.62 40.26 43.30 30.66 29.73 19.64 20.18 33.48 33.63 38.49 38.84 33.33 29.41 20.53 17.11 32.16 27.03 36.40 35.87 28.13 28.51 20.53 21.62 32.31 32.43 40.43 37.77 31.25 31.08 21.24 19.00 32.47 27.17 41.88 42.04 32.59 31.83 23.55 20.72 40.77 38.39

Page 50: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

50

42.29 40.62 34.80 30.94 22.22 19.28 33.19 36.61 38.59 37.38 28.76 28.05 20.09 18.83 29.65 31.39 37.55 34.68 29.77 27.27 21.97 18.30 29.20 28.38

Fuente: Datos sin publicar, usados por cortesía del Ing. M. Fuentes Salinas, Universidad Austral de Chile. 1991.

El análisis de los datos de la Tabla 8 fue hecho con el Paquete Estadístico SAS y se usó el siguiente programa: Tabla 9. Programa SAS para el análisis de un diseño completamente al azar con submuestreo. DATA DCAS; INFILE 'A:\EJDCA.DAT'; INPUT TRAT $ UE RESP;PROC ANOVA; CLASS UE; MODEL RESP = UE; TITLE 'PARTICION 1: "SCT = SC(UE) + SCEM"'; PROC SORT; BY TRAT UE; PROC MEANS; BY TRAT UE; VAR RESP; OUTPUT OUT=B SUM=SRESP; DATA DOS; SET B; RESPM=SRESP/SQRT(9); KEEP TRAT RESPM; PROC ANOVA; CLASS TRAT; MODEL RESPM = TRAT; TITLE 'PARTICION 2: "SC(UE) = SCtrat + SCEE"'; RUN; Como se observa en el programa de la Tabla 9, el procedimiento ANOVA de SAS se ejecuta dos veces; la primera ejecución es para ajustar el modelo original basado en las unidades experimentales (9) y los resultados de SAS incluyen a la SCT particionada en la SC(UE) y la SCEM (partición 1). La segunda ejecución corresponde al ajuste del modelo (50) de la Sección 4.5.2 y lo que hace es particionar a la SC(UE) en la SCtrat y la SCEE (partición 2). En la Tabla 10 se presenta la salida de SAS del programa de la Tabla 9.

Tabla 10. Salida de SAS de un diseño completamente al azar con submuestreo

PARTICION 1: "SCT = SC(UE) + SCEM" Analysis of Variance Procedure

Dependent Variable: RESP Source DF Sum of

Squares Mean Square

F Value Pr > F

Model 7 3521.5154 503.0736 54.41 0.0001 Error 64 590.6442 9.2288 Corrected Total

71 4112.1597

R-Square C.V. Root MSE RESP

Mean 0.856366 9.789623 3.0379 31.03181 Source DF Anova SS Mean F Value Pr > F

Page 51: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

51

Tabla 10. Salida de SAS de un diseño completamente al azar con submuestreo Square UE 7 3521.5154 503.0736 54.41 0.0001

PARTICION 2: "SC(UE) = SCtrat + SCEE" Analysis of Variance Procedure

Dependent Variable: RESPM Source DF Sum of

Squares Mean Square

F Value Pr > F

Model 3 3493.6044 1164.5348 166.89 0.0001 Error 4 27.9110 6.978 Corrected 7 3521.5154 Total R-Square C.V. Root MSE RESPM

Mean 0.992074 2.837458 2.6415 93.09542 Source DF Anova SS Mean

Square F Value Pr > F

TRAT 3 3493.6044 1164.5348 166.89 0.0001 Los datos de la Tabla 10 se organizan de forma resumida en un formato de Análisis de Varianza en la Tabla 11. Se toman las tres primeras hileras de la partición 1 y la última hilera de la partición 2 y se organizan como en la Tabla 11. Observe que el error que se reporta en la partición 1 de Tabla 10, es el error muestral y el error que se reporta en la partición 2 de la misma tabla, es el error experimental. Observe también que la SCT de la partición 2, corresponde a la SC(UE) de la partición 1.

Tabla 11. Análisis de varianza a partir de la tabla 10. FV GL SC CM Fcal Ftab UE 7 3521.5154 503.0736 72.09 trat 3 3493.6044 1164.5348 166.89 6.59 EE 4 27.9119 6.9778 0.76 2.53 EM 64 590.6442 9.2288 Total 71 4112.1597

en donde, como de costumbre, trat: tratamientos; EE: error experimental; EM: error muestral. 7.2. Ejemplo del diseño bloques completos al azar con submuestreo En un lote experimental ubicado en Casas Blancas, Michoacán se ensayaron siete tratamientos de fertilización (ver Tabla 12) empleando un diseño de bloques completos al azar, con la finalidad de estudiar el efecto que tiene la gallinaza en combinación con otros elementos, sobre la composición química del suelo. Las variables de respuesta registradas fueron las cantidades de calcio, magnesio, sodio, potasio y nitrato en partes por millón (ppm) que contenía el suelo después de un periodo de haber aplicado los tratamientos; para facilitar la presentación de este ejemplo, se utiliza sólo el contenido de nitrato (NO3) en ppm como variable respuesta. Los tratamientos se repitieron en tres bloques y se tomaron 3 submuestras por unidad experimental. Los datos de este

Page 52: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

52

experimento son reportados por Baus Picard y Alcalde (1979); los tratamiento aplicados se presentan en la Tabla 12 y la porción de los datos usados en este ejemplo, se presentan en la Tabla 13.

Tabla 12. Tratamientos aplicados en un lote experimental. Tratamiento Nitrógeno (kg) Fósforo (kg) Gallinaza (ton) 1 150 0 0 2 150 400 0 3 150 400 0 4 150 400 5 5 150 400 20 6 0 0 20 7 0 0 0 Fuente: Reportados por Baus Picard y Alcalde (1979).

Tabla 13. Contenido de NO3 de las muestras de suelo

analizadas en (ppm) B l o q u e s

Trats Obs Bloq 1 Bloq 2 Bloq 3 1 1 76 158 174 1 2 80 158 176 1 3 76 156 179 2 1 66 174 162 2 2 76 175 168 2 3 66 176 162 3 1 76 152 178 3 2 98 146 174 3 3 98 138 176 4 1 147 148 160 4 2 156 148 16 4 3 148 148 15 5 1 140 175 194 5 2 140 174 188 5 3 141 173 188 6 1 140 195 178 6 2 164 195 178 6 3 140 195 178 7 1 100 102 156 7 2 84 108 156 7 3 87 108 156

Fuente: Datos reportados por Baus Picard y Alcalde (1979) El programa SAS para obtener el Análisis de Varianza (ANOVA) de los datos de un diseño de bloques completos al azar con submuestreo, está estructurado bajo el mismo razonamiento en que se basa el programa del diseño completamente aleatorio. En la primera partición, la SCT es dividida en

Page 53: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

53

la SC(UE) y la SCEM; con el segundo modelo se particiona a la SC(UE) en la SCbloq, SCtrat y SCEE, que son las fuentes de variación que componen a la SC(UE) en este diseño. El programa en SAS se presenta en la Tabla 14. Tabla 14. Programa SAS para el análisis de un diseño de bloques completos al azar con submuestreo DATA DBCAS; INFILE 'A;\EJDBCA.DAT'; INPUT BLOQUE TRAT RESP; UE = (10 *BLOQUE) + TRAT; PROC ANOVA; CLASS UE; MODEL RESP=UE; TITLE 'PARTICION 1: "SCT = SC(UE)+ SCEM"; PROC SORT;BY BLOQUE TRAT; PROC MEANS; BY BLOQUE TRAT; VAR RESP; OUTPUT OUT=B SUM=SRESP; DATA NUEVAS; SET B; Y=SRESP/SQRT(3); KEEP BLOQUE TRAT Y; PROC ANOVA; CLASSES BLOQUE TRAT; MODEL Y=BLOQUE TRAT; TITLE 'PARTICION 2: "SC(UE) = SCbloq + SCtrat + SCEE"'; RUN; Al ejecutar el programa anterior usando los datos de la Tabla 13, se obtiene una salida de SAS que se presenta a continuación:

Tabla 15. Salida de SAS del diseño de bloques completos al azar con submuestreo PARTICION 1: "SCT = SC(UE) + SCEm"

Analysis of Variance Procedure Dependent Variable: RESP Source DF Sum of

Squares Mean Square

F Value Pr > F

Model 20 83901.746 4 195.087 148.81 0.001 Error 42 1184.000 28.190 Corrected 62 85085.746 Total R-Square C.V. Root MSE RESP

Mean 0.98 085 3.635043 5.3095 146. 635 Source DF Anova SS Mean

Square F Value Pr > F

UE 20 83901.746 4 195.087 148.81 0.001 PARTICION 2: "SC(UE) = SCbloq + SCtrat + SCEE"

Analysis of Variance Procedure Dependent Variable: Y Source DF Sum of

Squares Mean Square,

F Value Pr > F

Page 54: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

54

Model 8 65621.651 8202.706 5.38 0.048 Error 12 18280.095 1523.341 Corrected 20 83901.746 Total R -Square C.V. Root MSE Y Mean 0.78 125 15.42753 39.030 252.894 Source DF Anova SS Mean

Square F Value Pr > F

Bloq 2 44295.460 22147.730 14.54 0.006 TRAT 6 21326.190 3554.365 2.33 0.998

A partir de la tabla anterior se presenta el análisis de varianza de la Tabla 16. Observe nuevamente que el error reportado en la partición 1, es el error muestral y el error de la segunda partición es el error experimental. Las hileras de las UE (Model) y del Total de la Tabla 16, se toma de la partición 1 de la Tabla 15, y las hileras correspondientes a los bloques (Bloq) y los tratamientos (trat), se toman de la partición 2. Observe otra vez que la SCT de la segunda partición corresponde al valor de la SC(UE) de la primera partición.

Tabla 16. Análisis de varianza a partir de la tabla 15. FV GL SC CM Fcal Ftab UE 20 83901.746 4195.087 148.81 Bloq 2 44295.460 22147.730 14.54 3.89 Trat 6 21326.190 3554. 365 2.33 3.0 EE 12 18280.095 1523.341 54.04 2.0 EM 42 1184.000 28.190 Total 62 85085.746

7.3. Ejemplo del diseño en cuadro latino con submuestreo Para ejemplificar el análisis del diseño en cuatro latino con submuestreo, se usan los resultados parciales de un experimento de aclareos del área basal realizado en el ejido La Victoria, Pueblo Nuevo, Durango en un bosque de Pinus cooperi. Se usó un cuadro latino de 6 x 6 para ensayar seis diferentes intensidades (en %) de aclareo del área basal (tratamientos) y estudiar la influencia que esta práctica silvícola ejerce sobre el diámetro, la altura, la proyección de copa, etc, del arbolado. Como variable respuesta, se estudian los incrementos del diámetro normal (a 1.3 m) en un periodo de cuatro años, y se consideran tres submuestras por unidad experimental. El % de aclareo del área basal en los seis tratamientos aplicados en este experimento, son los siguientes:

Tratamiento % de aclareo del área basal A 20 B 30 C 50 D 70 E 100 F 0

Los tratamientos se distribuyeron así sobre el terreno:

Columnas Hileras I II III IV V VI

Page 55: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

55

Columnas Hileras I II III IV V VI I F E D C B A II E C A D F B III B A F E D C IV A B E F C D V D F C B A E VI C D B A E F

y los datos usados para fines de este ejemplo son los siguientes:

Tabla 17. Incremento en diámetro normal (en cm) en un bosque en cuatro años Columnas

Hileras I II III IV V VI 1.6 1.5 3.0 2.9 1.9 1.5 I 2.2 2.1 1.8 1.8 1.6 3.0 2.7 3.4 3.1 3.7 2.8 3.3 1.7 3.1 2.4 3.0 1.4 1.8 II 3.4 2.2 2.5 1.7 3.0 1.7 2.0 2.7 2.5 1.8 2.8 2.4 1.8 2.3 2.8 1.7 1.8 2.2 III 2.7 2.0 2.2 3.1 3.3 1.3 2.6 3.5 1.8 3.5 2.4 1.4 1.9 1.8 2.5 3.0 1.8 1.5 IV 2.6 2.9 2.5 1.9 2.7 2.9 1.7 1.7 2.6 2.4 2.3 2.0 2.6 3.0 1.6 2.3 3.0 3.2 V 1.8 2.2 2.3 2.2 1.9 3.3 1.9 2.2 2.3 3.0 2.3 2.5 1.8 2.4 2.2 2.0 2.6 3.3 VI 2.8 1.8 3.0 1.9 3.2 2.4 2.3 2.3 1.5 2.2 2.2 2.6

Fuente: Datos sin publicar, usados con el permiso del Ing. G. Cortés Jaramillo. 1993. Para hacer el análisis de los datos de un experimento en cuadro latino con submuestreo y basándose en los primeros dos pasos del algoritmo anteriormente expuesto, se tiene el siguiente programa: Tabla 18. Programa SAS para un experimento en cuadro latino DATA DCLS; INFILE 'A:\EJDCL.DAT'; INPUT HIL COL TRAT $ RESP; UE=(HIL * 10)+ COL; PROC ANOVA; CLASS UE;

Page 56: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

56

MODEL RESP=UE; TITLE 'PARTICION 1: SCT = SC(UE) + SCEM '; PROC SORT;BY HIL COL TRAT; PROC MEANS; BY HIL COL TRAT; VAR RESP; OUTPUT OUT=B SUM=SRESP; DATA NUEVAS;SET B;Y=SRESP/SQRT(3); KEEP HIL COL TRAT Y; PROC ANOVA; CLASSES HIL COL TRAT; MODEL Y = HIL COL TRAT; TITLE 'PARTICION 2: SC(UE) = SCHIL +SCcol + SCtrat + SCEE '; RUN; De la ejecución del programa anterior, resulta la Tabla 19:

Tabla 19. Salida de SAS de un cuadro latino con submuestreo PARTICION 1: SCT = SC(UE) + SCEM

Dependent Variable: RESP Source DF Sum of

Squares Mean Square

F Value Pr > F

Model 35 8.2851852 0.2367196 0.62 0.9364 Error 72 27.2866667 0.3789815 Corrected 107 35.5718519 Total R-Square C.V. Root MSE RESP

Mean 0.232914 26.05266 0.6156 2.362963 Source DF Anova SS Mean

Square F Value Pr > F

UE 35 8.2851852 0.2367196 0.62 0.9364 PARTICION 2: SC(UE) = Scchil + SCcol + SCtrat + SCEE

Dependent Variable: Y Source DF Sum of

Squares Mean Square

F Value Pr > F

Model 15 1.3111111 0.0874074 0.62 0.8278 Error 20 2.8314815 0.1415741 Corrected 35 4.1425926 Total R-Square C.V. Root MSE Y Mean 0.316495 13.00138 0.3763 2.894027 Source DF Anova SS Mean

Square F Value Pr > F

HIL 5 0.1825926 0.0365185 0.26 0.9307 COL 5 0.2492593 0.0498519 0.35 0.8748 TRAT 5 0.8792593 0.1758519 1.24 0.3268

Ordenando los datos de la Tabla 19 como se indica en el tercer paso del algoritmo, se genera una Tabla de Análisis de Varianza como:

Page 57: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

57

Tabla 20. Análisis de varianza a partir de la tabla 19. FV Gl SC CM Fcal UE 35 8.2851852 0.0365185 Hil 5 0.1825926 0.0498519 0.26 Col 5 0.2493593 0.1758519 0.35 Trat 5 0.8792593 0.1415741 1.24 EE 20 2.8314815 0.3789915 0.37 EM 72 27.2866667 Total 107 35.5718519

Observe que la SC(UE) es el resultado de adicionar las sumas de cuadrados siguientes: SChil, SCcol, SCtrat y SCEE; para obtener la SCT se suman la SC(UE) y la SCEM.

Page 58: Universidad Autónoma Chapingo División de Ciencias ... · PDF fileen la experimentación agronómica y forestal; sin embargo, en el análisis estadístico de la

58

8. LITERATURA CITADA BAUS PICARD y ALCALDE. 1979. Efecto de la Gallinaza sobre Algunos Cambios Físicos y

Químicos en un Suelo de Ando. Publicado en "Los Suelos de Ando", Colegio de Postgraduados, Chapingo, Méx. pp. 89-108.

CHING CHUN, L. 1969. Introducción a la Estadística Experimental. Traducido por Griselda Ribó. Barcelona, España, Omega. pp. 109-111.

GRAYBILL, F. 1969. Introduction to Matrices with Applications in Statistics. Belmont, California, Wadsworth Publishing. pp. 14-17.

MARTINEZ GARZA, A. 1988. Diseños Experimentales: Métodos y Elementos de Teoría. México, D.F., Trillas. 755 p.

SEARLE, S:R: 1966. Matrix Algebra for the Biological Sciences. New York, USA, John Wiley & Sons. pp. 199-201.

SNEDECOR, G. & W. COCHRAN. 1967. Statistical Methods. Sixth edition. Ames, USA, Iowa State University. pp. 285-288.

STEEL, R. y J. TORRIE. 1988. Bioestadística: Principios y Procedimientos. Traducido por Ricardo Martínez. México, D.F., McGraw-Hill. 621 p.