manual de infostat

Upload: jose-acan

Post on 12-Jul-2015

1.700 views

Category:

Documents


5 download

TRANSCRIPT

Centro guatemalteco de investigacin y capacitacin de la caa de azcar. -CENGICAA-

Joel Morales, Jos Luis Quem y Mario Melgar.

Primera Edicin

Santa Lucia Cotz. Agosto 2009.

InfoStatContenido

Aspectos generales de InfoStat ........................................................................................................................... 1 Aspecto de la base de datos: Video. ............................................................................................................... 1 Cmo importar una base de datos desde Excel? ....................................................................................... 1 Cmo pegar una base de datos desde Excel? ............................................................................................ 2 Transformacin de datos ................................................................................................................................ 3 Prueba de hiptesis ............................................................................................................................................. 4 Trminos de importancia al realizar una prueba de hiptesis ......................................................................... 4 Pasos para evaluar una hiptesis estadstica. .................................................................................................. 5 Prueba de hiptesis acerca de una media poblacional normal. Video ............................................................ 5 Prueba de hipotesis acerca de dos medias (parcelas apareadas). Video ........................................................ 8 Prueba de hiptesis acerca de dos medias independientes. Video ................................................................. 9 Diseo completamente al azar .......................................................................................................................... 10 Caractersticas generales .............................................................................................................................. 10 Utilizacin del diseo ................................................................................................................................... 10 Supuestos del modelo. .................................................................................................................................. 10 Diseo de bloques completos al azar ................................................................................................................ 14 Hiptesis del modelo .................................................................................................................................... 14 Supuestos del modelo ................................................................................................................................... 14 Serie de Experimentos ...................................................................................................................................... 19 Anlisis de experimentos factoriales ................................................................................................................ 23 Arreglos combinatorios ................................................................................................................................ 24 Parcelas divididas ......................................................................................................................................... 28 Franjas divididas........................................................................................................................................... 31 Anlisis de correlacin lineal simple. ............................................................................................................... 34 Regresin Lineal............................................................................................................................................... 36 RL Simple..................................................................................................................................................... 36 Supuestos del modelo de regresin .......................................................................................................... 37 RL Mltiple .................................................................................................................................................. 41 Bibliografa....................................................................................................................................................... 42 Anexos .............................................................................................................................................................. 43

Manual de uso

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Aspectos generales de InfoStatAspecto de la base de datos: Video.La base de datos es la matriz de informacin, sobre la que se trabaja. La forma de ingreso de la informacin es en base a los criterios de organizacin de datos, donde se colocan en las columnas las variables y en las filas las observaciones, por lo que cada fila es un individuo o unidad experimental y cada celda contiene el dato o el valor que pertenece a cada variable para cada observacin. Cmo importar una base de datos desde Excel? InfoStat posee grandes ventajas respecto a la facilidad en el manejo de datos, es muy verstil en la importacin de datos desde Excel (versin 2003 o anterior), esto es importante, pues este ltimo es muy utilizado en la generacin de bases de datos tomados en campo. Es posible importar directamente una base de datos desde Excel y otros formatos. Esto facilita el manejo y presentacin de los mismos. 1

Figura 1: Seleccin de la hoja de clculo importada desde Excel.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Cmo pegar una base de datos desde Excel? Muchas veces poseemos la base de datos de tal forma, que no coincide la primera fila y la primera columna con informacin propia de la base , o se poseen objetos distintos como grficas o logotipos. Considerando esto, es relativamente fcil, el copiar la base de datos que se desea analizar de forma directa a la tabla de InfoStat. Para esto se puede incluir la primera fila como el nombre de las columnas o no. Se debe de presionar el botn derecho del ratn y seleccionar la opcin pegar o pegar incluyendo nombre de columnas. 2

Figura 2: Como pegar una base de datos en la tabla de InfoStat.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Transformacin de datosMuchas veces se trabaja con variables cualitativas o datos no paramtricos, los cuales no cumplen con el supuesto de normalidad. Por lo anterior es necesario realizar transformacin de estos datos. InfoStat ofrece una gran cantidad de transformaciones para una variable, y a la vez permite la operacin entre variables. 3

Figura 3: Men a seleccionar para realizar una transformacin

Para realizar la transformacin se debe de seleccionar la variable, luego de indicar que se desea realizar una transformacin.

Figura 4: Opciones de trasformacin

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Prueba de hiptesis Hiptesis Nula (Ho)

Esta es la que el investigador evala y est dispuesto a sostener como probable, a menos que la evidencia experimental en su contra sea sustancial. Hiptesis alternativa (Ha) 4

Es la negacin de la hiptesis nula.

Trminos de importancia al realizar una prueba de hiptesis Error tipo I ()

Es la probabilidad de rechazar una Ho cuando es falsa. Error tipo II ()

Es la probabilidad de no rechazar una Ho Cundo es falsa.Cuadro 1: Posibles errores.

Tomada de Anderson, E; Black, W. et al. 1999.

Nivel de significancia

Es el valor de probabilidad de error tipo I, que el investigador est dispuesto a aceptar.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Pasos para evaluar una hiptesis estadstica.1.

Definir la hiptesis nula y alternativa adecuada para el caso de evaluacin.

Cuadro 2: Casos de hiptesis a evaluar

5 2. Seleccionar el estadstico de prueba, necesario para evaluar la hiptesis.Cuadro 3: Estadsticos utilizados en la prueba de hiptesis

Tomado de Lpez, E. 2008.

3. Especificar el nivel de significancia. 4. Establecer la regla de decisin. 5. Establecer los valores del estadstico seleccionado de la prueba y compararlo con el valor critico establecido. 6. Conclusin.

Prueba de hiptesis acerca de una media poblacional normal. VideoEjemplo: En una regin caera se siembra predominantemente una variedad de caa de azcar que tiene un TCH promedio de 103.5 toneladas ha-1. Un programa de mejoramiento ha desarrollado una nueva variedad, comnmente usada, con rendimientos mayores a la variedad predominante. Para probar esta aseveracin se siembran nueve lotes experimentales con la nueva variedad y se obtienen los siguientes rendimientos:

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Cuadro 4: Rendimiento en toneladas de caa por hectrea, tomado de 9 lotes distintos.

Lote 1 2 3 4 5 6 7 8 9 Prom.

TCH 103.15 103.92 104.26 103.36 103.72 104.19 103.42 104.38 104.5 103.88

6

Identificacin del parmetro sobre el cual se desea inferir en base a la muestra: Media () Hiptesis a probar: Ho: 103.5 Ha: >103.5 Eleccin del modelo probabilstico bajo el cual se operar: La t de Student Especificacin del nivel de significancia. = 5% o 0.05 Establecer la regla de decisin: Se Rechaza la Ho si p

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

7

Figura 5: Ubicacin de la prueba

Se debe de seleccionar la columna a analizar y se debe de indicar el parmetro con el cual se realizar la comparacin.Prueba T para un parmetro Valor del parmetro probado: 103.5 Variable n Media DE LI(95) TCH 9 103.88 0.49 103.57 T 2.32 p(Unilateral D) 0.0246

La regla de desicin: En base a la prueba T, se observa una probabilidad de p = 0.0246. Este valor es menor a la probabilidad permitida (= 0.05), por lo que se rechaza Ho. Conclusin: La muestra apoya la aseverain del programa de mejoramiento.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Prueba de hipotesis acerca de dos medias (parcelas apareadas). VideoCuadro 5: Rendimientos en toneladas de caa por hectarea, de dos variedades tamados de 6 lotes.

NF 1 2 3 4 5 6 Prom.

CP72-2086 160 112 184 186 104 152 150

CG97-77 130 118 225 149 168 139 155

8

Es importante que se ingresen los datos en dos columnas, una para cada poblacin o conjunto de datos.

Figura 6: Ubicacin de la prueba

En este caso la hiptesis a evaluar es: Ho: la diferencia entre las medias es igual a cero, que es igual a decir que ambas medias son iguales 1 = 2. Ha: 1 2.Prueba T (muestras apareadas)Obs(1) Obs(2) CG97-77 CP72-2086 media(dif) 5.17 Media(1) 154.83 Media(2) 149.67 DE(dif) T 40.23 0.31 Bilateral 0.7658

Conclusin: En base a las evidencias se puede aseverar que los tonelajes de ambas variedades son semejantes.InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Prueba de hiptesis acerca de dos medias independientes. VideoCuadro 6: Rendimientos en toneladas de caa por hectrea, bajo dos tratamientos de aplicacin de fosforo.

Fosforo 0 P0 150 155 149 153

Fosforo 240 P240 165 167 168 167

9

Es necesario que para ingresar los datos en InfoStat, se debe de crear una columna donde se coloque el nombre o cdigo de la variable, til para la clasificacin, y una columna donde se ingrese el valor de la variable a estudiar.

Figura 7: Ubicacin de la prueba

Prueba T para muestras IndependientesVariab Grupo(1)Grupo(2) TCH {P0} {P240} media(1) 151.75 media(2) 166.75 p(Var.Hom.) T 0.2307-9.91 p 0.0001

Conclusin: Al observar la salida del anlisis, se puede decir que el rendimiento del tratamiento P240 es mayor que el rendimiento del tratamiento P0.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Diseo completamente al azarEs importante que al momento de realizar un anlisis de varianza, se tenga bien claro las fuentes de variacin consideradas por dicho modelo.

10

Tomado de Lpez, E. 2008

Como la media general y el error experimental son trminos que poseen en comn todos los modelos, no es necesario el indicarlos entre las fuentes de variacin.

Caractersticas generales Se usa cuando las unidades experimentales son homogneas Con el se puede probar cualquier nmero de tratamientos (ya sean niveles de un solo factor o combinaciones de nivel de varios factores) Los tratamientos se aplican a las unidades experimentales al azar. Cualquier nmero de repeticiones por tratamiento es posible.

Utilizacin del diseoEste diseo se recomienda cuando existe homogeneidad entre unidades experimentales, esto quiere decir que no existe influencia de la ubicacin de la unidad experimental sobre el efecto del tratamiento, esto es muy utilizado en ensayos a nivel de laboratorio, cuando se utilizan macetas o medios de cultivos, donde las condiciones son las mismas para todas las unidades experimentales.

Supuestos del modelo. Los errores son independientes. Los errores estn normalmente distribuidos con media cero y varianza constante Existe homogeneidad de varianzas entre los tratamientos El modelo es lineal y de efectos aditivos.InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Ejemplo: Video.Cuadro 7: Rendimiento (TCH), evaluando 3 frecuencias de riego.

Tratamientos Testigo (prctica regional) Riego cada 21 das Riego cada 28 das Riego cada 35 dasTomado de Martnez, A. (1998).

Repeticin 1 123 175 199 179

Repeticin 2 133 167 203 188

Repeticin 3 131 192 166 203

11

En este caso los datos se deben de ingresar en la Tabla de InfoStat, indicando en una columna el tratamiento evaluado y en la columna de la par la variable de respuesta correspondiente a cada tratamiento.Cuadro 8: Tabla de datos como se debe de ingresar a InfoStat.

Tratamientos Testigo (prctica regional) Riego cada 21 das Riego cada 28 das Riego cada 35 das Testigo (prctica regional) Riego cada 21 das Riego cada 28 das Riego cada 35 das Testigo (prctica regional) Riego cada 21 das Riego cada 28 das Riego cada 35 das

TCH 123 175 199 179 133 167 203 188 131 192 166 203

En la pestaa estadsticas se encuentra la opcin anlisis de varianza, al aceptar aparece un cuadro donde se debe de indicar las variables dependientes (TCH) y las variables de clasificacin (Tratamientos). Para esto se debe de utilizar los botones de accin .

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

12

Figura 8: Seleccin de las variables.

Al aceptar aparecer otro recuadro, donde se debe indicar las fuentes de variacin del modelo, como ya se mencion la media general y el error no se indican. Esto se realiza en la pestaa . A un lado se encuentra la pestaa donde se puede indicar la prueba de media que se desea realizar, donde se encuentran varias opciones.

Figura 9: Seleccin del mtodo de comparacin de medias.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Anlisis de la varianza Variable TCH N 12 R 0.83 R Aj CV 0.77 7.98

Cuadro de Anlisis de la Varianza (SC tipo III) F.V. SC gl CM F p-valor Modelo 7526.25 3 2508.75 13.37 0.0018 Tratamientos 7526.25 3 2508.75 13.37 0.0018 Error 1500.67 8 187.58 Total 9026.92 11 Test:LSD Fisher Alfa=0.05 DMS=25.78763 Error: 187.5833 gl: 8 Tratamientos Medias Riego cada 35 das 190.00 Riego cada 28 das 189.33 Riego cada 21 das 178.00 Testigo (prctica regional.. 129.00

13n 3 3 3 3 A A A B

Letras distintas indican diferencias significativas(p