aproximación a r a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de...

103
42 31 16 20 2 0 0 0 14 9 3 2 58 23 23 10 25 6 11 5 2 0 0 0 3 3 2 0 0 0 0 1 2 5 0 0 5 8 2 0 2 11 13 1 0 3 2 2 0 2 0 1 13 5 2 3 0 5 9 7 Especies Especies 1 2 3 4 Cyclope neritea 42 31 16 20 Nassarius mutabilis 2 0 0 0 Nassarius sp 14 9 3 2 Bittium sp 58 23 23 10 Turritella sp 25 6 11 5 Mangelia attenuata 2 0 0 0 Raphitoma sp 3 3 2 0 Turbonilla sp 0 0 0 1 Cerastoderma edule 2 5 0 0 Mactra stultorum 5 8 2 0 Chamelea gallina 2 11 13 1 Dosinia lupinus 0 3 2 2 Dosinia sp 0 2 0 1 Donax trunculus 13 5 2 3 Corbula gibba 0 5 9 7 Especies Especies Estaciones Estaciones ¿? BIODIVERSIDAD Y CONSERVACIÓN Sesión 3: Aproximación al entorno R a través de los análisis multivariantes J. Emilio Sánchez Moyano

Upload: others

Post on 02-Oct-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

1 2 3 4Cyclope neritea 42 31 16 20Nassarius mutabilis 2 0 0 0Nassarius sp 14 9 3 2Bittium sp 58 23 23 10Turritella sp 25 6 11 5Mangelia attenuata 2 0 0 0Raphitoma sp 3 3 2 0Turbonilla sp 0 0 0 1Cerastoderma edule 2 5 0 0Mactra stultorum 5 8 2 0Chamelea gallina 2 11 13 1Dosinia lupinus 0 3 2 2Dosinia sp 0 2 0 1Donax trunculus 13 5 2 3Corbula gibba 0 5 9 7

Espe

cies

Espe

cies

EstacionesEstaciones

1 2 3 4Cyclope neritea 42 31 16 20Nassarius mutabilis 2 0 0 0Nassarius sp 14 9 3 2Bittium sp 58 23 23 10Turritella sp 25 6 11 5Mangelia attenuata 2 0 0 0Raphitoma sp 3 3 2 0Turbonilla sp 0 0 0 1Cerastoderma edule 2 5 0 0Mactra stultorum 5 8 2 0Chamelea gallina 2 11 13 1Dosinia lupinus 0 3 2 2Dosinia sp 0 2 0 1Donax trunculus 13 5 2 3Corbula gibba 0 5 9 7

Espe

cies

Espe

cies

EstacionesEstaciones

¿ ?

BIODIVERSIDAD Y CONSERVACIÓN

Sesión 3: Aproximación al entorno R a través

de los análisis multivariantes

J. Emilio Sánchez Moyano

Page 2: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R

Introducción a R

El entorno R es un lenguaje y una colección integrada de programas para cálculo y análisis de datos y representaciones gráficas

Page 3: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R

Fuente: R. A. Muenchen The Popularity of Data Analysis Software. http://r4stats.com/articles/popularity/

Introducción a R

Page 4: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Ventajas

Software libre y gratis

Multiplataforma

Flexibilidad

Ayuda extensa, listas de correo, foros,…

Métodos en continuo desarrollo

Generación de gráficos de alta calidad

Introducción a R

Page 5: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Inconvenientes

Funciona mediante líneas de comando

Carece de estructura gráfica

Lenguaje de sintaxis complicada

Toda la documentación en inglés

Introducción a R

Page 6: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Instalación https://www.r-project.org/

Introducción a R

Page 7: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Instalación

Introducción a R

Page 8: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Consola de R: RGui

Introducción a R

Page 9: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Alternativas en la web

http://www.math.montana.edu/Rweb/

Introducción a R

Page 10: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Interfaces gráficas

R-Commander http://www.rcommander.com/

Interfaz orientada a proporcionar al usuario una experiencia similar a la de los programas comerciales clásicos (p.e. SPSS) donde los análisis están disponibles mediante un sistema de menús y cuadros de diálogo (en español o inglés).

No es necesario escribir el código, por lo tanto es adecuado para principiantes y para alumnos

Inconveniente: los análisis son reducidos (aunque en progresión) si bien se puede utilizar como la consola Rgui mediante códigos y comandos

Introducción a R

Page 11: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Interfaces gráficas

https://www.rstudio.com/

Introducción a R

Page 12: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Interfaces gráficas

Área 1: Editor de códigos, scripts,

visualización de tablas y variables,…

Área 2: Consola de R

Área 3: Espacio de trabajo e

historial

Área 4: Directorio de archivos,

paquetes instalados, gráficos

y ayuda

Importante: comprueba la ortografía y tiene una función de autocompletado

Introducción a R

Page 13: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Inicio de sesión

En el área 2 (consola de R), tras la cabecera, aparece una línea en blanco con el símbolo > en el margen izquierdo: PROMPT.

A partir de aquí hay que escribir COMANDOS e instrucciones para comenzar a trabajar.

Para ejecutar un comando escrito utilizamos la tecla INTRO.

Área 2: Consola de R

Introducción a R

Page 14: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Las órdenes elementales consisten en EXPRESIONES o en ASIGNACIONES:

● Si una orden consiste en una expresión, se evalúa, se imprime y su valor se pierde para posteriores órdenes o funciones.

● Una asignación, por el contrario, evalúa una expresión, no la imprime y guarda su valor en una variable. Se utiliza el símbolo <- o =● Cuando se escribe la asignación +INTRO, nos devuelve el valor o contenido de esa asignación

Biodiversidad y Conservación

INTRODUCCIÓN A R: Inicio de sesión

Introducción a R

Page 15: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Funciones

Elementos de una función:

Nombre ( argumentos, opciones )

Ejemplo

sum( ): da la suma de una serie de números

> sum(6,5,3,4)

[1] 18

obligatorio: nombre y paréntesis

argumentos y opciones: valores, objetos

Funciones básicas (en el programa base)

Funciones recomendadas (incluidas en la instalación)

Funciones de paquetes (packages)

Funciones propias

Ejemplo con asignación

sum( ): da la suma de una serie de números

Suma<- sum(6,5,3,4)

Suma

[1] 18

Introducción a R

Page 16: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Funciones

Mediante los comandos:

? o ??

help

apropos ( )

Archivos de ayuda

Introducción a R

Page 17: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Mediante los comandos:

Conocer directorio de trabajo: getwd ( )

Asignar directorio de trabajo:

setwd ("directorio_de_trabajo")

Ejemplo:

> setwd ("C:/Practica Biod/")

Biodiversidad y Conservación

INTRODUCCIÓN A R: Funciones Establecer directorio de trabajo

Introducción a R

Page 18: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Funciones Área de trabajo/Archivo histórico

Todos los objetos que se crean en R se almacenan en el área de trabajo (workspace) (extensión .Rdata)

Guardar el workspace: save.image( )

Recuperar un workspace previamente guardado: load( )

Ver qué objetos se encuentran en el workspace: ls( )

Eliminar objetos del workspace: rm( )Todos los comandos que se van ejecutando en R se guardan en un archivo histórico

Guardar el archivo histórico:

savehistory(file= "nombre_de_archivo.Rhistory")

Recuperar archivo histórico:

loadhistory(file= "nombre_de_archivo.Rhistory")

Introducción a R

Page 19: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Funciones Algunos operadores o funciones básicas

Numérico

> x <- c(1,2,5)

> mode(x)

[1] "numeric"

Lógico

> h <"TRUE"

> mode (h)

[1] "logical"

mode (x) : devuelve el tipo de datos

c ( ) : define un vector o conjunto ordenado de valores

Ejemplo:

> x <- c(1,2,5)

>x

[1] 1 2 5

> y<- c(“hembra“,”macho”,”juvenil”)

> y

[1] “hembra“ ”macho” ”juvenil”

Carácter (deben de ir entre " ")

> y<- c(“hembra“,”macho”,”juvenil”)

> mode(y)

[1] "character"

Complejo

> z <"1e"

> mode(z)

[1] "complex"

Introducción a R

Page 20: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Funciones Algunos operadores o funciones básicas

Introducción a R

Page 21: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Búsqueda e instalación de paquetes (packages)

La instalación del entorno R incluye el paquete base para que R pueda funcionar y la mayoría de las funciones fundamentales, así como paquetes recomendados

Introducción a R

Page 22: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Búsqueda e instalación de paquetes (packages)

install.packages ("nombre_del_paquete")

update.packages ( ): actualiza los paquetes

Introducción a R

Page 23: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Búsqueda e instalación de paquetes (packages)

library(): muestra los paquetes instalados disponibles

library("nombre_del_paquete"): carga el paquete en memoria

Introducción a R

Page 24: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Búsqueda e instalación de paquetes (packages)

Introducción a R

Page 25: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Búsqueda e instalación de paquetes (packages)

Introducción a R

Page 26: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Hojas de datos (data frames)

Ejemplo

> lapa <- data.frame (Abundancia= c(8,25,5,12), Habitat=c(“Natural”, “Artificial”), Reproducción=c(“False”,“True”))

>lapa

Abundancia Habitat Reproducción

1 8 Natural False

2 25 Artificial True

3 5 Natural False

4 12 Artificial True

data.frame (x) : crea una tabla de datos. Se pueden combinar datos numéricos, caracteres y lógicos

Introducción a R

Page 27: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Hojas de datos (data frames)

Ejemplo

> colnames (lapa)

[1] “Abundancia” “Hábitat” “Reproducción”

> row.names (lapa)

[1] “1” “2” “3” “4”

>row.names (lapa)<- c(“Bahía Sur”, “Dique Poniente”, “Bahía Norte”, “Dique Levante”)

>row.names (lapa)

[1] “Bahía Sur” “Dique Poniente”, “Bahía Norte”, “Dique Levante”

>lapa

Abundancia Hábitat Reproducción

Bahía Sur 8 Natural False

Dique Poniente 25 Artificial True

Bahía Norte 5 Natural False

Dique Levante 12 Artificial True

row.names ( ) : devuelve o asigna un nombre a cada fila de una tabla de datos.

colnames ( ) : devuelve o asigna un nombre a cada columna de una tabla de datos.

Introducción a R

Page 28: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Hojas de datos (data frames)

$ : indexa o da acceso a variables concretas (columnas) de una tabla de datos.

Ejemplo

> lapa$Abundancia

[1] 8 25 5 12

[ , ] : da acceso a los elementos, filas o columnas concretas de una tabla de datos.

Ejemplo

> lapa [,1] Devuelve la columna 1 (en este caso, “abundancia”)

[1] 8 25 5 12

>lapa[1,] Devuelve la fila 1 (en este caso, “Bahía Sur”)

[1] Abundancia Hábitat Reproducción

Bahía Sur 8 Natural False

>lapa[1,1] Devuelve el dato de la columna 1 y la fila 1

[1] 8

Introducción a R

Page 29: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Hojas de datos (data frames)

attach / dettach: "ancla" o “desancla” una hoja de datos al entorno de R para así poder utilizar las variables por su nombre sin necesidad de indexar. Se recomienda evitar estas funciones

Ejemplo

>attach (lapa)

>Habitat

[1] Natural Artificial Natural Artificial

Levels: Artificial Natural

Introducción a R

Page 30: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Hojas de datos (data frames)

Write.table: guarda la hoja de datos en un archivo

write.table(x, file = "data", sep = " “ )x: nombre del data.frame

file: nombre del archivo (con extensión, por ejemplo, .txt, .csv, .wk1, .xls. etc)

sep: delimitador de columnas, por defecto espacio (por ejemplo, "\t" para tabulado, “,”, etc)

Ejemplo

>write.table (lapa, file=“datoslapa.txt”, sep = “”)

Introducción a R

Page 31: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Importar hojas de datos

read.table (“nombre_archivo") Archivos en formato de texto

Principales argumentos:

read.table (“nombre_archivo.txt“, header=TRUE, row.names=1, sep= “ ”, nastrings= “NA”,

dec=“.”, strip.white=TRUE)

Introducción a R

Page 32: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Importar hojas de datos

read.table (“nombre_archivo") Archivos en formato de texto

Principales argumentos:

read.table (“nombre_archivo.txt“, header=TRUE, row.names=1, sep= “ ”, nastrings= “NA”,

dec=“.”, strip.white=TRUE)

La primera fila lleva los nombres de las columnas o variables

La primera columna lleva los nombres de los casos o muestras

Introducción a R

Page 33: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Importar hojas de datos

read.table (“nombre_archivo") Archivos en formato de texto

Principales argumentos:

read.table (“nombre_archivo.txt“, header=TRUE, row.names=1, sep= “ ”, na.strings= “NA”,

dec=“.”, strip.white=TRUE)

Indica el carácter que separa cada columna. Por defecto: espacio. Otros: tabulador (“\t”), coma, punto y coma, etc

Indica el carácter para señalar los valores perdidos (missing data). Por defecto: NA

Introducción a R

Page 34: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Importar hojas de datos

read.table (“nombre_archivo") Archivos en formato de texto

Principales argumentos:

read.table (“nombre_archivo.txt“, header=TRUE, row.names=1, sep= “ ”, na.strings= “NA”,

dec=“.”, strip.white=TRUE)

Indica el carácter para los decimales. Por defecto: “.”

Para coma: “,”

Permite utilizar espacios en blanco en los campos de texto si se ha indicado un separador. Por ejemplo: “Bahía Sur” en vez de “Bahía_Sur”

Introducción a R

Page 35: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Importar hojas de datos

read.table (“nombre_archivo") Archivos en formato de texto

Otros comandos:

file=“clipboard": para importar directamente desde el portapapeles

Ejemplo: read.table(file= “clipboard")

file=file.choose():permite elegir directamente un archivo en Windows

read.table("http://direción_web"): importar datos desde internet

Introducción a R

Page 36: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Importar hojas de datos Archivos en formato de texto desde RStudio

Introducción a R

Page 37: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Importar hojas de datos

Archivos en otros formatos

Cuando el decimal es un punto

read.delim( ): para archivos tabulados

read.csv( ): para archivos en formato .csv(comma-separated values)

Cuando el decimal es una coma

read.delim2( ):para archivos tabulados

read.csv2( ): para archivos en formato .csv

Introducción a R

Page 38: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

INTRODUCCIÓN A R: Importar hojas de datos

Archivos en otros formatos

Paquete foreign

read.dta: lee archivos Stata (.dta)

read.spss: lee archivos Spss

read.systat: lee archivos Systat

read.S: lee archivos binarios de S

read.dbf: lee archivos dBase (.dbf)

Paquete gdata

read.xls (“archivo.xls”, sheet=1): Archivos .xls y .xlsx (pre- y post Office 2007)

Paquete xlsx

read.xlsx (“archivo.xlsx”, sheet): Archivos .xlsx

Introducción a R

Page 39: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

ANÁLISIS MULTIVARIANTES

Un conjunto de datos multivariantes consiste en más de una variable registrada a partir de un número determinado de muestras o de unidades experimentales, que suelen definirse como objetos.

Organismo vivo

Unidad ecológica

medidas morfológicas, fisiológicas, comportamiento,…

abundancia de especies, variables fisicoquímicas,…

Análisis multivariantes

Un análisis multivariante hace referencia a cualquier método estadístico que analice simultáneamente múltiples características en cada uno de los individuos o muestras objeto de la investigación

Page 40: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

1.- Suele existir un alto número de ceros.

2.- La mayoría de las especies se localizan en pocas estaciones y contribuyen poco a la abundancia total.

3.- El número de factores que puede influir en la composición de una comunidad es potencialmente muy grande.

4.- El número de factores importantes suele ser bajo, es decir, sólo unos pocos factores explican la mayor parte de la variación.

5.- Suele haber mucho ruido, ya que las réplicas varían unas de otras debido a fenómenos estocásticos, distribuciones contagiosas e, incluso, errores de los observadores.

6.- Existe información redundante: las especies suelen compartir distribuciones similares y una puede ser explicada por la otra.

Orden/Clase Familia OD390 OD460 OD430 TI290 CP030 CP070 CP140 H140Annelida

Oligochaeta Oligoquetos 20 0 20 120 7 27 227 0Capitellidae 167 7 13 13 20 0 27 4Cirratulidae 0 0 0 0 0 0 60 0Chrysopetalidae 0 0 0 7 0 0 0 0Eunicidae 0 0 0 0 0 0 13 0Glyceridae 0 7 0 0 0 0 20 4Hesionidae 0 0 0 0 0 0 47 0Nephtyidae 0 0 20 13 0 0 27 28Nereidae 73 33 20 193 27 13 7 4Onuphidae 0 0 0 0 0 7 0 0Orbiniidae 0 0 0 7 0 0 40 116Paraonidae 0 0 0 33 13 7 0 0Phyllodocidae 0 0 0 0 0 0 7 4Pilargidae 0 0 0 0 0 0 113 0Pisionidae 0 0 0 0 0 0 0 8Poecilochaetidae 0 0 0 0 0 0 0 4Polynoidae 7 0 0 0 0 0 0 0Serpulidae 0 0 0 0 0 0 80 20Sigalionidae 0 0 0 93 0 0 100 0Spionidae 593 873 2567 1540 553 200 107 4Syllidae 0 0 0 0 0 0 40 0Terebellidae 0 0 0 0 0 0 13 0

CnidariaHexacorallaria Anémonas 0 0 0 0 0 7 0 0

CrustaceaAmpeliscidae 0 0 0 7 0 7 73 0Aoridae 0 0 0 180 0 0 0 0Caprellidae 0 0 13 0 0 0 27 0Corophiidae 0 0 13 267 7 0 107 12Dexaminidae 0 0 0 0 0 0 0 4Gammaridae 7 20 7 240 20 0 0 8Haustoridae 0 0 0 0 0 0 0 12Ischyroceridae 0 0 0 7 0 0 0 0

Cumacea Bodotriidae 0 0 0 0 0 0 0 4Alpheidae 0 0 0 0 0 0 40 0Crangonidae 0 0 0 0 0 0 0 16Diogenidae 0 0 0 0 0 0 0 20Grapsidae 0 0 0 0 0 0 0 4Hippolytidae 0 0 0 0 0 0 27 0Penaeidae 7 0 0 0 0 0 0 0Portunidae 0 0 0 0 0 0 7 0Processidae 0 0 0 7 0 0 13 0Xanthidae 0 0 0 0 0 0 7 0Anthuridae 240 73 7 327 140 7 60 0Ligiidae 0 0 0 0 0 0 7 0

Mysidacea Mysidacea 0 0 0 0 0 0 0 24Tanaidacea Leptocheliidae 0 0 0 13 0 0 93 8

MolluscaAnomiidae 0 0 0 0 0 0 13 4Cardiidae 100 20 33 13 7 0 0 8Corbulidae 0 0 0 0 0 0 7 132Glycimeridae 0 0 0 0 0 0 0 4Hiatellidae 0 0 0 0 0 0 0 4Mactridae 0 13 0 0 0 0 40 44Mytilidae 0 0 0 0 0 0 0 4Ostreidae 0 0 0 173 0 0 0 0Tellinidae 0 13 0 0 0 0 0 0Venereidae 0 0 0 0 0 0 0 416

ESTACIONES

Isopoda

Bivalvia

Polychaeta

Amphipoda

Decapoda

Análisis multivariantes

ANÁLISIS MULTIVARIANTES: TABLAS BIOLÓGICAS

Biodiversidad y Conservación

Page 41: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

ANÁLISIS DE ORDENACIÓN

ANÁLISIS DE CLASIFICACIÓN

Sitúan o clasifican a las variables y/o muestras en grupos afines, normalmente de forma jerárquica

Sitúan a las variables y/o muestras en un espacio n-dimensional a lo largo de gradientes

ANÁLISIS DE GRADIENTES

MULTIVARIANTES

Dada la naturaleza continua de las comunidades, la ordenación parece resultar en una aproximación más natural. La clasificación sitúa a las muestras en clases definidas a lo largo del gradiente, pero si el gradiente es continuo se pueden dar resultados “extraños” cuando existen muestras con comunidades intermedias entre clases

ANÁLISIS MULTIVARIANTES

Análisis multivariantes

Biodiversidad y Conservación

Page 42: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

OD390OD460OD430

TI290

CP030

CP070CP140

H140

Estrés= 0.02

Similaridad de Bray-Curtis

CP070

TI290

OD460

OD430

OD390

CP030

CP140

H140

100 80 60 40 20

Odiel-Tinto

Estudio de la fauna bentónica submareal del sistema Odiel-Tinto (Huelva)

ANÁLISIS DE ORDENACIÓN

ANÁLISIS DE CLASIFICACIÓN

Análisis multivariantes

Biodiversidad y Conservación

Page 43: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Los resultados son muy sensibles a la medida elegida y “esconden” información, es decir, se ordenan las muestras pero se pierde la información sobre las especies individuales

Stn A Stn B Stn C

Sp 1

Sp 2

Sp 3

Sp 4

1 2 15

4 6 12

9

20

12 3

18 3

Stn D

12

6

2

0

Stn A Stn B Stn C

Sp 1

Sp 2

Sp 3

Sp 4

1 2 15

4 6 12

9

20

12 3

18 3

Stn D

12

6

2

0

89

33

26

36

35 79

Stn A Stn B Stn C

Stn A

Stn B

Stn C

Stn D

Stn D

89

33

26

36

35 79

Stn A Stn B Stn C

Stn A

Stn B

Stn C

Stn D

Stn D

BA

CD

Medida distancia

Una buena medida de distancia ecológica debe ser capaz de describir la diferencia en la composición de las especies entre sitios

Análisis multivariantes

Biodiversidad y Conservación

ANÁLISIS MULTIVARIANTES: MEDIDAS DE DISTANCIA

Page 44: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Distancias Euclídeas

Donde :xij es el valor del parámetro i en la estación j

xik es el valor del parámetro i en la estación k

2)( ikij xxD ∑ −=

Chi-cuadrado 2

)()(

⎟⎟⎠

⎞⎜⎜⎝

⎛−

+

+=

∑∑∑ ∑ ∑ik

ik

ij

ij

ikij

ikij

xx

xx

xxxx

D

Muy utilizada con variables ambientales.No es una buena medida de distancia ecológica para abundancias de especies. Bajo una transformación puede llegar a ser una buena medida.No está restringida a valores de 0 a 1.

No es la ideal para datos de abundancia aunque es utilizada en algunos métodos de ordenación. Depende de las diferencias de las especies en proporción de su abundancia. Muy influida por las especies menos abundantes. No está restringida a valores de 0 a 1

∑ ∑∑ ⎟⎟

⎜⎜

⎛−=

2

ik

ik

ij

ij

xx

xx

DHellinger

Similar a chi-cuadrado, aunque parece que muestra mejor las distancias ecológicas.

Análisis multivariantes

Biodiversidad y Conservación

ANÁLISIS MULTIVARIANTES: MEDIDAS DE DISTANCIA

Page 45: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

( )∑∑

+

−=

ikij

ikij

xxxx

DBray-Curtis

⎥⎥⎦

⎢⎢⎣

⎡ −+

−=

∑∑

∑∑

ik

ikij

ij

ikij

xxx

xxx

D21

Kulczynski

Donde :xij es el valor del parámetro i en la estación j

xik es el valor del parámetro i en la estación k

Muy útil para datos de abundancia al no tener en cuenta las dobles ausencias.Se calcula sobre las diferencias en las abundancias de cada especie. Muy influida por las especies muy abundantes. Se recomienda transformar previamente los datos por la raíz cuadrada, raíz cuarta o logaritmo.Toma valor de 0 a 1.

Comportamiento similar a Bray-Curtis.

Análisis multivariantes

Biodiversidad y Conservación

ANÁLISIS MULTIVARIANTES: MEDIDAS DE DISTANCIA

Page 46: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

vegdist(x, method="bray", upper=FALSE, na.rm = FALSE, ...) : devuelve la matriz de disimilaridad con el índice elegido

Paquete vegan

Argumentos:

x: archivo de datosmethod=“bray”: informa sobre la unidad de medida (bray= Bray-Curtis). Otras medidas: "manhattan", "euclidean","canberra", "bray", "kulczynski", "jaccard", "gower", "altGower","morisita","horn", "mountford", "raup" , "binomial", "chao","cao“, "mahalanobis“upper: devuelve sólo la parte superior de la matrizna.rm: elimina las comparaciones con datos perdidos

Análisis multivariantes

Biodiversidad y Conservación

ANÁLISIS MULTIVARIANTES: MEDIDAS DE DISTANCIA

Page 47: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Análisis clasificación

Biodiversidad y Conservación

ANÁLISIS MULTIVARIANTES: ANÁLISIS CLASIFICACIÓN

Sitúan o clasifican a las variables y/o muestras en grupos afines.

En estudios de comunidades se agrupan de forma jerárquica

Selección de medida de distancia es fundamental

El algoritmo de agrupación más habitual es UPGA (Unweighed Pairwise GroupAverage): se unen los grupos por la distancia media

Índice de Similaridad100.90.80.70.60.50.40.30.20.10.

GU7

GU6

GU5

H2B

H1B

CR1

H2

H1

CR2

GU8

GU4

GU3

GU2

GU1

Page 48: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Análisis clasificación

Biodiversidad y Conservación

Paquete BiodiversityR (basado en vegan) http://www.worldagroforestry.org/resources/databases/tree-diversity-analysis

Comando BiodiversityRGUI ( )

Page 49: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Análisis clasificación

Biodiversidad y Conservación

Paquete BiodiversityR (basado en vegan)

Page 50: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Análisis clasificación

Biodiversidad y Conservación

Paquete BiodiversityR (basado en vegan) Primer paso: importar datos

Page 51: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Análisis clasificación

Biodiversidad y Conservación

Paquete BiodiversityR (basado en vegan) Primer paso: importar datos

Se corresponde con la consola de R. Se ven todos las funciones que se ejecutan y los resultados

R Script: se genera un archivo de texto con todas la funciones. Se puede guardar y volver a ejecutar un análisis, total o parcial, sin necesidad de volver a escribir todos los comandos.

Page 52: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Análisis clasificación

Biodiversidad y Conservación

Paquete BiodiversityR (basado en vegan) Primer paso: importar datos

Peces <- read.table("C:/R/fish.txt", header=TRUE, row.names=1,sep="\t", na.strings="NA", dec=".", strip.white=TRUE)

Una pequeña corrección!!

Page 53: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Análisis clasificación

Biodiversidad y Conservación

Paquete BiodiversityR: Ejemplo de clasificación Datos: bichos.txt

Page 54: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Análisis clasificación

Biodiversidad y Conservación

Paquete BiodiversityR: Ejemplo de clasificación Datos: bichos.txt

hclust: hierarchical cluster

Page 55: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Análisis clasificación

Biodiversidad y Conservación

Paquete BiodiversityR: Ejemplo de clasificación Datos: bichos.txt

Page 56: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Análisis clasificación

Biodiversidad y Conservación

Paquete BiodiversityR: Ejemplo de clasificación Datos: bichos.txt

Page 57: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Análisis clasificación

Biodiversidad y Conservación

Paquete BiodiversityR: Ejemplo de clasificación Datos: bichos.txt

Una vez en el portapapeles se puede exportar a otros programas como Powerpoint y editar la figura

Page 58: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

0.0

0.4

0.8

5b 3c 3a 3b 1a 1b 2b 2a 2c 4c 4a 4b 1c 5a 5c

Análisis clasificación

Biodiversidad y Conservación

Paquete BiodiversityR: Ejemplo de clasificación Datos: bichos.txt

Dis

imila

rida

d

1

5

4

32

Zona intermareal

Page 59: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Análisis clasificación

Biodiversidad y Conservación

Ejercicio 1: Realizar un análisis de clasificación y representar el dendrograma con los datos de algas del estudio del intermareal de la Isla de Tarifa. Interpreta los resultados. Archivo: algas.txt

Page 60: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

ANÁLISIS DE ORDENACIÓN

Análisis de Ordenación

Parámetro GU1 GU2 GU3 GU4Aceites y Grasas 60 57,2 47,2 169,4Hidrocarburos 8,1 7 23,3 40,3Carbonatos 0,5 1,4 5,5 1,5Fosfatos 0,25 0,32 0,5 0,19COT 0,7 < 0.50 0,61 < 0.50Materia orgánica 1,43 0,96 1,64 1,86Nitrógeno Total 292 411 389 321Cadmio <7.171 <4.883 <10.122 <4.487Cinc 55,394 125,376 149,051 130,354Cobre <8.963 19,899 17,461 14,808

Cromo <35.854 <24.416 <50.611 <22.436Mercurio <0.036 <0.024 <0.051 <0.021

Níquel <17.927 20,265 <25.306 18,173Vanadio 17 30 30 40ICM6 6,68 7,24 10,95 6,48Sulfuros < 0.05 < 0.05 < 0.05 < 0.05

ESTACIONES

Familia GU1 GU2 GU3 GU4

Sphaerodoridae 0 0 4 0Syllidae 0 0 4 4Sabellidae 0 0 8 0Serpulidae 0 0 0 0Cirratulidae 0 0 0 0Magelonidae 0 0 0 0Spionidae 0 0 3216 1044Ampharetidae 0 0 21136 2140Pectinariidae 0 0 0 0Terebellidae 0 0 0 0Trichobranchidae 0 0 0 0Oligoquetos 24 68 4 0

ESTACIONES

Gradiente indirecto(unconstrained ordination)

Biodiversidad y Conservación

Sitúan a las variables y/o muestras en un espacio n-dimensional a lo largo de gradientes

Se basan en un tipo de matriz, ya sea con datos bióticos o abióticos, de tal forma que interpretamos los resultados en función de un tipo de datos e inferimos lo que puede estar sucediendo. Por ejemplo, una ordenación de las especies de una comunidad nos puede informar indirectamente que variable ambiental es la más probable que está marcando esa distribución, pero sin una significación estadística. Por tanto, es una herramienta exploratoria.

Page 61: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

ANÁLISIS DE ORDENACIÓN

Análisis de Ordenación

Parámetro GU1 GU2 GU3 GU4Aceites y Grasas 60 57,2 47,2 169,4Hidrocarburos 8,1 7 23,3 40,3Carbonatos 0,5 1,4 5,5 1,5Fosfatos 0,25 0,32 0,5 0,19COT 0,7 < 0.50 0,61 < 0.50Materia orgánica 1,43 0,96 1,64 1,86Nitrógeno Total 292 411 389 321Cadmio <7.171 <4.883 <10.122 <4.487Cinc 55,394 125,376 149,051 130,354Cobre <8.963 19,899 17,461 14,808

Cromo <35.854 <24.416 <50.611 <22.436Mercurio <0.036 <0.024 <0.051 <0.021

Níquel <17.927 20,265 <25.306 18,173Vanadio 17 30 30 40ICM6 6,68 7,24 10,95 6,48Sulfuros < 0.05 < 0.05 < 0.05 < 0.05

ESTACIONES

Familia GU1 GU2 GU3 GU4

Sphaerodoridae 0 0 4 0Syllidae 0 0 4 4Sabellidae 0 0 8 0Serpulidae 0 0 0 0Cirratulidae 0 0 0 0Magelonidae 0 0 0 0Spionidae 0 0 3216 1044Ampharetidae 0 0 21136 2140Pectinariidae 0 0 0 0Terebellidae 0 0 0 0Trichobranchidae 0 0 0 0Oligoquetos 24 68 4 0

ESTACIONES

Gradiente directo(constrained ordination)

Biodiversidad y Conservación

Utilizan de forma conjunta ambos tipos de datos. En su forma más simple pueden considerarse como una técnica de regresión, en la cual la composición de especies está relacionada con las variables medidas. A diferencia de los indirectos, permite testar la hipótesis nula de que la composición de las especies no está relacionada con las variables medidas. Por tanto, es una herramienta confirmatoria.

Page 62: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Modelos lineales

Modelos unimodales

PCoA PCA CAnMDS DCA

CCA*RDA CCA

db-RDA CoICAP

Basados en eigenanalysis

Gradiente indirecto (unconstrained

ordination)Gradiente directo

(constrained ordination)

Basados en medidas de distancia

Basado en Ter Braak & Prentice, 1988

CCA*: Análisis de Correlaciones Canónicas (Canonical Correlation Analysis)

CCA: Análisis de Correspondencias Canónicas (Canonical Correspondence Analysis)

PRINCIPALES ANÁLISIS DE ORDENACIÓN

Análisis de Ordenación

Biodiversidad y Conservación

Page 63: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Basado en Ter Braak & Prentice, 1988

CCA*: Análisis de Correlaciones Canónicas (Canonical Correlation Analysis)

CCA: Análisis de Correspondencias Canónicas (Canonical Correspondence Analysis)

PRINCIPALES ANÁLISIS DE ORDENACIÓN

Análisis de Ordenación

Biodiversidad y Conservación

Modelos lineales

Modelos unimodales

PCoA PCA CAnMDS DCA

CCA*RDA CCA

db-RDA CoICAP

Basados en eigenanalysis

Gradiente indirecto (unconstrained

ordination)Gradiente directo

(constrained ordination)

Basados en medidas de distancia

Page 64: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

B

A

CD B

AC

D

nMDS o MDS o NMS: NON-METRIC MULTIDIMENSIONAL SCALING

No se basa en el dato de la medida de distancia sino que preserva el rango de orden de las disimilaridades en el rango de orden de las distancias. El ajuste entre ambos rangos es medida por un coeficiente de estrés (coeficiente de Kruskal), el cual tiende a cero cuando los dos rangos coinciden

89

33

26

36

35 79

Stn A Stn B Stn C

Stn A

Stn B

Stn C

Stn D

Stn D

89

33

26

36

35 79

Stn A Stn B Stn C

Stn A

Stn B

Stn C

Stn D

Stn D

BA

CD

B

A

C

D

Se selecciona la configuración con menor estrés

Análisis de Ordenación: MDS

Biodiversidad y Conservación

Page 65: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Gradiente Indirecto: Medidas de distancia: nMDS

Diseño de experimentos y análisis de datos: Análisis de Ordenación

La ordenación resultante puede ser arbitrariamente rotada, reflejada o expandida, por lo que se suele prescindir de los ejes en la representación gráfica

El orden de los ejes es arbitrario de tal forma que el primer eje no es necesariamente el más importante

Nunca es arbitraria la posición relativa de los puntos

La ordenación va a depender del número de dimensiones seleccionadas y, normalmente, el estrés disminuye con el número de dimensiones.

B

AC

D

Estrés<0,05 (<5%) ordenación excelente

Estrés<0,1 (<10%) buena ordenación

Estrés<0,2 (<20%) ordenación útil, aunque puede existir un error potencial

Estrés>0,2 (>20%) dudosa interpretación. Estrés entre 0,35-0,40 puede significar que las muestras estén ordenadas al azar

Ojo, no es una regla fija!!

Análisis de Ordenación: MDS

Biodiversidad y Conservación

Page 66: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Ejemplo: Estudio la competencia de especies de aves nectívoras en un bosque de eucaliptos en Victoria (Australia). Datos consisten en 27 especies de aves en 8 sitios con diferente intensidad de floración: 2 con alta floración (“good sites”); 2 con intermedia (“medium sites”; 2 con escasa floración (“poor sites”); y 2 cercanos a “good sites” para testar posible efecto de exportación (“adjacent sites”). Cada estación fue muestreada usando un transecto en cinta durante 4 veces.

Archivo de datos: victor.txt (sólo consideramos “good” y “poor sites”(Mac Nally & Timewell 2005)

Red Wattle Bird (Anthochaera carunculata)

Yellow-tufted Honeyeater

(Lichenostomus sp)

Honeyeater

(Melithreptus sp)

Análisis de Ordenación: MDS

Biodiversidad y Conservación

Page 67: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Análisis de Ordenación: MDS

Biodiversidad y Conservación

La transformación previa de los datos permite suavizar las diferencias cuando hay valores extremos.

Una de las más utilizadas con datos de abundancia es la raíz cuadrada (“square”)

Page 68: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Gradiente Indirecto: Medidas de distancia: PCoA

Diseño de experimentos y análisis de datos: Análisis de Ordenación

Análisis de Ordenación: MDS

Biodiversidad y Conservación

Nª de permutaciones o repeticiones del análisis para alcanzar la mejor configuración.

Poner 100 Repetir “plot” en ordiplot y label sites

Page 69: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Gradiente Indirecto: Medidas de distancia: nMDS

Diseño de experimentos y análisis de datos: Análisis de Ordenación

Victoria <- read.table("C:/Emilio/Asignaturas/Biodiversidad/Sesión 3/Archivos txt/victor.txt", header=TRUE, row.names=1, sep="\t", na.strings="NA", dec=".", strip.white=TRUE)

Victoria.orig <- Victoria

Victoria <- disttransform(Victoria, method='square')

check.datasets(Victoria, Victoria)

distmatrix <- vegdist(Victoria, method='bray', na.rm=T)

dist.eval(Victoria,'bray')

Ordination.model1 <- NMSrandom(distmatrix, perm=100, k=2)

check.ordiscores(Victoria,Ordination.model1, check.species=F)

Ordination.model1

par(cex=1)

plot1 <- ordiplot(Ordination.model1, choices=c(1,2))

ordilabel(plot1, 'sites', col='blue', cex=1)

Análisis de Ordenación: MDS

Biodiversidad y Conservación

Script o códigos empleados

Page 70: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Gradiente Indirecto: Medidas de distancia: nMDS

Diseño de experimentos y análisis de datos: Análisis de Ordenación

> Ordination.model1

$points

[,1] [,2]

P11 3.00339249 -4.8455118

P12 1.19996249 -11.1210371

P13 -0.25160825 -4.6023833

P14 -3.71244110 -2.9461695

P21 4.83962150 0.9477869

P22 5.41714805 1.1917068

P23 4.46666375 0.7051313

P24 4.85204018 2.1440109

G51 -0.39266712 3.6421916

G52 0.65762539 4.2234979

G53 0.54794877 3.3096922

G54 -3.90807708 0.8565153

G61 -0.05125528 2.8478532

G62 0.91480698 3.8190795

G63 -3.74658037 4.1727569

G64 -4.77027167 4.2353971

$stress

[1] 13.66863

-4 -2 0 2 4

-10

-50

5

Dim1

Dim

2

P11

P12

P13

P14

P21

P22P23

P24

G51

G52

G53G54

G61

G62

G63G64

Análisis de Ordenación: MDS

Biodiversidad y Conservación

Estrés<0,2 (<20%) ordenación útil, aunque puede existir un error potencial

Page 71: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

P11

P12

P13

P14

P21 P22P23

P24

G51G52G53

G54G61G62

G63G64

D01

$points

[,1] [,2]

P11 -0.06720815 4.0320946

P12 3.77000029 10.5072947

P13 1.77800813 3.4653222

P14 -2.11196241 1.6962517

P21 4.19643301 1.0645992

P22 4.74815759 -0.4581607

P23 4.13753061 0.3691910

P24 3.71361406 0.9166820

G51 -0.29807981 -3.0996818

G52 -0.05026403 -2.7862682

G53 0.86211367 -3.0958862

G54 -0.88378004 -3.1674469

G61 0.79563879 -2.9348722

G62 1.28422245 -2.8983789

G63 -1.80454597 -2.1684901

G64 -0.80191041 -3.7650867

D01 -10.48471111 12.5463105

$stress

[1] 9.492608

Cuando un punto es muy diferente al resto se suele localizar en los extremos de la ordenación de forma aleatoria y suele forzar el agrupamiento del resto de puntos

Consejo: eliminar el punto y repetir el análisis

Análisis de Ordenación: MDS

Biodiversidad y Conservación

Page 72: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Gradiente Indirecto: Medidas de distancia: nMDS

Diseño de experimentos y análisis de datos: Análisis de Ordenación

Ejercicio 2: Efecto de la contaminación y el gradiente ambiental sobre la comunidad de invertebrados bentónicos en el estuario del río Odiel (Huelva). Se estudiaron 7 estaciones localizadas a lo largo del cauce principal desde Huelva (estación A) hasta la desembocadura en Mazagón (estación G) . Los datos consisten en nº de individuos/m2 de 51 familias de invertebrados. Realizar un análisis MDS basado en Bray-Curtis. Previamente transformar los datos de abundancia por la raíz cuadrada para evitar el efecto de los valores extremos.

Archivo: odbio.txt(Sánchez-Moyano et al 2010)

G

F

E

D

C

A

B

G

F

E

D

C

A

B

Análisis de Ordenación: MDS

Biodiversidad y Conservación

Page 73: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Se obtienen un grupo de nuevas variables cada una de las cuales son una combinación lineal de las variables originales

PCA: ANÁLISIS DE COMPONENTES PRINCIPALES/ PRINCIPAL COMPONENTS ANALYSIS

Stn A Stn B Stn C

Sp 1

Sp 2

Sp 3

Sp 4

1 2 15

4 6 12

9

20

12 3

18 3

Stn D

12

6

2

0

Stn A Stn B Stn C

Sp 1

Sp 2

Sp 3

Sp 4

1 2 15

4 6 12

9

20

12 3

18 3

Stn D

12

6

2

0

Stn A Stn B Stn C

-

Stn DStn A Stn B Stn C

PC 1

Stn D

PC 2

PC 3

-- - - -

0,5 1,2 0,8 3,1

2,1 1,6 1,3 0,7

0,5 0,4 2.7 1,2

COMPONENTES PRINCIPALES

Biodiversidad y Conservación

Análisis de Ordenación: PCA

La primera nueva variable explica la mayor parte de la varianza de las variables originales, la segunda la mayoría del resto de la varianza extraída la primera variable, y así sucesivamente.

Cada una de estas nuevas variables es independiente y no está correlacionada con las otras (ejes ortogonales).

El número de nuevas variables puede ser el mismo que las variables originales sólo que la mayor parte de la varianza es normalmente alcanzada con las primeras variables.

Page 74: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

El uso de las distancias euclídeas es útil para variables ambientales, donde el valor cero tiene un sentido intrínseco, mientras que no ofrece buenos resultados para datos de abundancia donde abundan los ceros

Las variables ambientales normalmente son medidas en diferentes unidades, por lo que antes de realizar el análisis hay que estandarizarlas para que puedan ser comparadas

Existen muchas estandarizaciones aunque la más normal en la mayoría de programas es restar la media y dividir por la desviación estándar de cada variable (zero mean and unit variance)

Distancias Euclídeas

Estandarización

Biodiversidad y Conservación

Análisis de Ordenación: PCA

Page 75: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

BAHBAHÍÍA DEA DEALGECIRASALGECIRAS

Ejemplo: Estudio ambiental de un pequeño puerto deportivo con altos niveles de contaminación orgánica (Dársena del Saladillo) en el puerto de Algeciras. Se cuadriculó la zona en 30 cuadrículas (200x200m) donde se tomaron muestras biológicas y fisicoquímicas del sedimento y el agua. Para el sedimento se seleccionaron 9 estaciones

Datos: saladsed.txt (9 estaciones y 7 variables)(Estacio et al 1997)

Biodiversidad y Conservación

Análisis de Ordenación: PCA

Page 76: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

decostand (x, method, MARGIN, na.rm=FALSE, ...) : permite estandarizar los datos con los métodos más habituales

Paquete vegan

Argumentos:

x: archivo de datosmethod=“standardize”: utiliza el método “zero mean and unit variance”MARGIN: 1: filas; 2:columnas (por defecto, 2)na.rm: elimina las comparaciones con datos perdidos

1.- Estandarización previa de la matriz

Site Oxigene Hydrocarbons

Fats Phosphate Nitrogen Organic matter

Sand

mg/l (ppm) (ppm) (P,ppm) (N,ppm) (%) (%)E1 5.1 332 38 933 463 2.9 74E2 5.2 863 97 800 863 6.8 33E3 4.4 4415 229 1537 1028 6.3 40E6 7.3 891 82 719 1574 8.1 25E7 6.8 1179 0 789 2011 13.2 20E9 8.3 106 11 484 223 3.7 98E11 8.1 20 31 356 120 2.9 99E13 8.8 25 38 450 79 2 99E17 8.3 13 8 388 120 3.3 98

Biodiversidad y Conservación

Análisis de Ordenación: PCA

Page 77: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Biodiversidad y Conservación

Análisis de Ordenación: PCA

Repetir “plot” en plot y label sites

Page 78: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Saladillo <- read.table("C:/CursoR/saladsed.txt", header=TRUE, row.names=1,sep="\t", na.strings="NA", dec=".", strip.white=TRUE)

saladstan<-decostand(Saladillo,"standardize")

check.datasets(saladstan, Saladillo)

dist.eval(saladstan,'euclidean')

Ordination.model1 <- rda(saladstan)

check.ordiscores(saladstan,Ordination.model1, check.species=T)

summary(Ordination.model1, scaling=1)

PCAsignificance(Ordination.model1)

goodness(Ordination.model1, display='sites', choices=c(1:4), statistic='explained')

inertcomp(Ordination.model1, display='sites', statistic='explained', proportional=F)

par(cex=1)

plot1 <- plot(Ordination.model1, choices=c(1,2), scaling=1)

abline(h = 0, lty = 3)

abline(v = 0, lty = 3)

ordilabel(plot1, 'sites', col='blue', cex=1)

Biodiversidad y Conservación

Análisis de Ordenación: PCA

Script o códigos empleados

Page 79: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

-2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5

-1.0

-0.5

0.0

0.5

1.0

1.5

PC1

PC

2

E1

E2

E3

E6

E7

E9E11

E13E17

> summary(Ordination.model1, scaling=1)

Partitioning of variance:

Inertia Proportion

Total 7 1

Unconstrained 7 1

Importance of components:

PC1 PC2 PC3 PC4 PC5 PC6 PC7

Eigenvalue 4.6532 1.7708 0.3759 0.14887 0.0455 0.004907 0.0008436

Proportion Explained 0.6647 0.2530 0.0537 0.02127 0.0065 0.000700 0.0001200

Cumulative Proportion 0.6647 0.9177 0.9714 0.99268 0.9992 0.999880 1.0000000

Biodiversidad y Conservación

Análisis de Ordenación: PCA

eigenvalues (valores propios): varianza explicada por cada una de las nuevas variables.Representan la varianza extraída por cada eje y es expresada como un porcentaje de la suma de todos los eigenvalues (es decir, la varianza total)

Page 80: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Species scores

PC1 PC2 PC3 PC4 PC5

Oxygene 1.0448 0.6316 -2.0999 -0.08921 0.8683

Hydrocarbons -1.1024 -0.7505 -1.3051 1.06587 -0.6344

Fats -0.9498 -1.1981 -0.9806 -1.59126 -0.2803

Phosphate -1.1520 -0.7459 0.3330 1.09131 1.4384

Nitrogen -0.9798 1.2776 -0.2467 -0.01884 1.3981

Organic.matter -0.8629 1.4623 -0.3697 0.71815 -1.4871

Sand 1.1146 -0.8710 -0.3169 1.44917 -0.1159

Site scores (weighted sums of species scores)

PC1 PC2 PC3 PC4 PC5

E1 0.01813 -0.29773 0.48077 0.08791 0.0973713

E2 -0.45293 0.01953 0.25032 -0.20973 -0.1201102

E3 -1.42023 -0.78038 -0.21739 0.07980 -0.0093453

E6 -0.42506 0.45124 -0.13640 -0.22129 0.1127302

E7 -0.64863 0.97109 -0.01298 0.19076 -0.0259651

E9 0.66984 -0.02966 -0.07195 0.09981 -0.0004776

E11 0.72885 -0.11615 -0.06438 -0.03298 -0.0697267

E13 0.77306 -0.18063 -0.17194 -0.04534 0.0638018

E17 0.75697 -0.03731 -0.05606 0.05107 -0.0482785

plot2<-biplot(Ordination.model1, scaling=1)

-2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5-1

.0-0

.50.

00.

51.

01.

5

PC1

PC

2

Oxygene

Hydrocarbons

Fats

Phosphate

NitrogenOrganic.matter

Sand

E1

E2

E3

E6

E7

E9E11E13E17

Biodiversidad y Conservación

Análisis de Ordenación: PCA

Page 81: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

aa<-cor(saladstand)

eigen(aa)

> aa

Oxygene Hydrocarbons Fats Phosphate Nitrogen Organic.matter Sand

Oxygene 1.0000000 -0.6962783 -0.69149675 -0.8886061 -0.4131979 -0.31181870 0.6235432

Hydrocarbons -0.6962783 1.0000000 0.89536238 0.9173309 0.4556640 0.37654830 0.5572037

Fats -0.6914968 0.8953624 1.00000000 0.8383613 0.2271320 0.09314038 -0.4410749

Phosphate -0.8886061 0.9173309 0.83836126 1.0000000 0.4826282 0.35708163 -0.6204746

Nitrogen -0.4131979 0.4556640 0.22713203 0.4826282 1.0000000 0.95884007 -0.9387293

Organic.matter -0.3118187 0.3765483 0.09314038 0.3570816 0.9588401 1.00000000 -0.8721045

Sand 0.6235432 -0.5572037 -0.44107492 -0.6204746 -0.9387293 -0.87210449 1.0000000

> eigen(aa)

$values

[1] 4.6531769878 1.7707940131 0.3759054490 0.1488741738 0.0454992985 0.0049065160 0.0008435618

$vectors

[PC,1] [,PC2] [,PC3] [,PC4] [,PC5] [,PC6] [PC,7]

[Oxygene] 0.3819495 0.2308757 0.76762013 -0.032612428 0.31741354 0.33123778 -0.006077368

[Hydrocarbons] -0.4029823 -0.2743671 0.47708928 0.389635819 -0.23189177 -0.19900287 -0.538072309

[Fats] -0.3472167 -0.4379618 0.35847530 -0.581694981 -0.10248235 -0.07587236 0.452213639

[Phosphates] -0.4211345 -0.2726530 -0.12173493 0.398934343 0.52579901 0.49731112 0.224844585

[Nitrogen] -0.3581802 0.4670327 0.09019858 -0.006886181 0.51107128 -0.60993177 0.110424681

[Organic matter] -0.3154339 0.5345687 0.13514266 0.262525217 -0.54361772 0.23246116 0.421896096

[Sand] 0.4074488 -0.3184112 0.11585295 0.529750685 -0.04235029 -0.41418532 0.514974822

Devuelve la matriz de correlación

Devuelve los eigenvalues y eigenvectorseigenvector (vectores propios): coeficiente que muestra cuánto contribuye cada variable original a la nueva variable

Biodiversidad y Conservación

Análisis de Ordenación: PCA

Page 82: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Método del círculo de equilibrio (method plot= ordiequilibriumcircle): aquellas variables que contribuyen significativamente a la ordenación tendrán vectores fuera del círculo

-2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5

-1.0

-0.5

0.0

0.5

1.0

1.5

PC1

PC

2Oxygene

Hydrocarbons

Fats

Phosphate

Nitrogen

Organic.matter

Sand

E1

E2

E3

E6

E7

E9E11E13E17

Biodiversidad y Conservación

Análisis de Ordenación: PCA

Page 83: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

> PCAsignificance(Ordination.model1)

1 2 3 4 5 6 7

eigenvalue 4.653177 1.770794 0.3759054 0.1488742 0.0454993 0.004906516 8.435618e-04

percentage of variance 66.473957 25.297057 5.3700778 2.1267739 0.6499900 0.070093085 1.205088e-02

cumulative percentage of variance 66.473957 91.771014 97.1410921 99.2678661 99.9178560 99.987949116 1.000000e+02

broken-stick percentage 37.040816 22.755102 15.6122449 10.8503401 7.2789116 4.421768707 2.040816e+00

broken-stick cumulative % 37.040816 59.795918 75.4081633 86.2585034 93.5374150 97.959183673 1.000000e+02

% > bs% 1.000000 1.000000 0.0000000 0.0000000 0.0000000 0.0000000 0.0000000

cum% > bs cum% 1.000000 1.000000 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000

Establecer bondad de ajuste entre la varianza mostrada por los componentes principales y la varianza total de los datos: método de la distribución del palo quebrado (broken-stick distribution)

Dos criterios para seleccionar el número de ejes significantes:

1.- Seleccionar aquellos ejes cuyo porcentaje de la varianza es mayor que su correspondiente en la distribución del palo quebrado.

2.- Seleccionar los ejes cuyo porcentaje acumulado de la varianza sea más grande que el correspondiente acumulado de la distribución del palo quebrado (menos conservativo)

Biodiversidad y Conservación

Análisis de Ordenación: PCA

Page 84: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Ejemplo: Composición de las especies de briofitas creciendo sobre troncos de árboles en 3 sitios en DukeForest, Carolina del Norte (Palmer 1986). Cada muestra representa la media de 10 árboles. BN =abedul (Betula nigra); LT = tulípero (Liriodendron tulipifera); PE = Pinus echinata; PO = plátano (Platanusoccidentalis); PT = Pinus taeda; QR= roble rojo (Quercus rubra); QA= roble blanco (Quercus alba). (Palmer 1986)

En gradientes ambientales medios o largos, con alta beta-diversidad, se puede producir una curvatura en la segunda o siguientes dimensiones (p.e., con datos de abundancia)

Efecto herradura (horseshoe effect)

-3 -2 -1 0 1 2

-2-1

01

PC1

PC

2

Amblys

An.atte

An.minor

An.rost

Brac.ac

Brac.oxyBryoCamp

ClasmDic.montDic.sco

EntoFrula

Haplo

Isop

Leucob

Leucod

Lopho

Platyg

PorelRad.comRad.obc

Semat

Thelia

Thuid

BN2

LT1LT2

PE3 PO2

PT1

PT3QA1QR1

Biodiversidad y Conservación

Análisis de Ordenación: PCA

Page 85: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Ejercicio 3: Efecto de la contaminación y el gradiente ambiental sobre la comunidad de invertebrados bentónicos en el estuario del río Odiel (Huelva). Se estudiaron 7 estaciones localizadas a lo largo del cauce principal desde Huelva (estación A) hasta la desembocadura en Mazagón (estación G) . Los datos consisten en 18 variables fisicoquímicas del sedimento y del agua de fondo. Estandarizar los datos y realizar un PCA. Calcular los eigenvalues y eigenvector.

Archivo: odfis.txt(Sánchez-Moyano et al 2010)

G

F

E

D

C

A

B

G

F

E

D

C

A

B

Biodiversidad y Conservación

Análisis de Ordenación: PCA

Page 86: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Modelos de respuesta a gradientes:

0

10

20

30

40

50

60

0 10 20 30 40 50 60 70

Gradiente ambiental

Abu

ndan

cia

0

10

20

30

40

50

60

0 10 20 30 40 50 60 70

Gradiente ambiental

Abu

ndan

cia

Modelo lineal: la respuesta de la especie aumenta de forma gradual con el gradiente (suele darse en gradientes cortos)

Modelo unimodal (Whittaker, 1967): la respuesta de la especie es unimodal, es decir, existe una única zona de condiciones óptimas donde las especies alcanzan sus máximas abundancias, y disminuye hacia ambos extremos

Salvo excepciones, la mayor parte de los sistemas ecológicos responden a un modelo unimodal

Análisis de Ordenación: CCA

CCA: ANÁLISIS DE CORRESPONDENCIAS CANÓNICAS/ CANONICAL CORRESPONDENCE ANALYSIS

Biodiversidad y Conservación

Page 87: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Análisis de Ordenación: CCA

En este análisis se maximiza las correlaciones entre los scores de muestras y especies, pero los scores de las muestras están restringidas como una combinación lineal de las variables explicativas.

Objetivo: si una combinación de variables está muy relacionada a la composición de especies, CCA crea un eje a partir de estas variables que hace que la respuesta unimodal de las especies sea más clara. Y así en los ejes sucesivos.

Existen tantos ejes (constrained axes) como variables explicativas

Biodiversidad y Conservación

UNA LIMITACIÓN: el análisis sólo admite un número máximo de variables inferior al número de muestras

Page 88: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Análisis de Ordenación: CCA

Biodiversidad y Conservación

Page 89: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Análisis de Ordenación: CCA

Biodiversidad y Conservación

Repetir “plot” en ordiplot y label sites(y/o label species)

Escribir 1000 permutaciones (por defecto son 100)

Aquí se seleccionan las variables a probar en el análisis

Page 90: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

BAHBAHÍÍA DEA DEALGECIRASALGECIRAS

Ejemplo: Estudio ambiental de un pequeño puerto deportivo con altos niveles de contaminación orgánica (Dársena del Saladillo) en el puerto de Algeciras. Se cuadriculó la zona en 30 cuadrículas (200x200m) donde se tomaron muestras biológicas y fisicoquímicas del sedimento y el agua. Para la fauna del sedimento se seleccionaron 9 estaciones

Datos: salbio.txt (9 estaciones y 138 especies) y salased.txt (9 estaciones y 7 variables)(Estacio et al 1997)

Análisis de Ordenación: CCA

Biodiversidad y Conservación

Page 91: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Salabio <- read.table("salbio.txt", header=TRUE, row.names=1, sep="\t", na.strings="NA", dec=".", strip.white=TRUE)

Salfis <- read.table("saladsed.txt", header=TRUE, row.names=1, sep="\t", na.strings="NA", dec=".", strip.white=TRUE)

salfistan<-decostand(Salfis,"standardize")

check.datasets(Salabio, salfistan)

Ordination.model1 <- cca(Salabio ~ Hydrocarbons + Organic.matter + Sand,salfistan)

check.ordiscores(Salabio,Ordination.model1, check.species=T)

summary(Ordination.model1, scaling=1)

RsquareAdj(Ordination.model1)

deviance(Ordination.model1)

vif.cca(Ordination.model1)

goodness(Ordination.model1, display='sites', statistic='explained')

inertcomp(Ordination.model1, display='sites', statistic='explained',proportional=T)

permutest(Ordination.model1, permutations=1000)

permutest(Ordination.model1, permutations=1000, first=T)

anova.cca(Ordination.model1, step=1000, by='terms')

anova.cca(Ordination.model1, step=1000, by='margin')

par(cex=1)

plot1 <- ordiplot(Ordination.model1, choices=c(1,2), scaling=1)

text(plot1, 'sites', col='blue', cex=1)

text(plot1, ‘species', col=‘red', cex=1)

Análisis de Ordenación: CCA

Biodiversidad y Conservación

Script o códigos empleados

Page 92: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

> summary(Ordination.model1, scaling=1)

cca(formula = Salabio ~ Hydrocarbons + Organic.matter + Sand, data = salfistan)

Partitioning of mean squared contingency coefficient:

Inertia Proportion

Total 2.185 1.0000

Constrained 1.072 0.4904

Unconstrained 1.114 0.5096

Eigenvalues, and their contribution to the mean squared contingency coefficient

Importance of components:

CCA1 CCA2 CCA3 CA1 CA2 CA3 CA4 CA5

Eigenvalue 0.6298 0.4009 0.04098 0.4575 0.2658 0.20995 0.14726 0.03302

Proportion Explained 0.2882 0.1835 0.01875 0.2093 0.1216 0.09608 0.06739 0.01511

Cumulative Proportion 0.2882 0.4717 0.49043 0.6998 0.8214 0.91750 0.98489 1.00000

Accumulated constrained eigenvalues

Importance of components:

CCA1 CCA2 CCA3

Eigenvalue 0.6298 0.4009 0.04098

Proportion Explained 0.5877 0.3741 0.03824

Cumulative Proportion 0.5877 0.9618 1.00000

La inercia explicada (explained orconstrained inertia) es la suma de los eigenvalues de los ejes restringidos

La inercia de los ejes no restringidos es considerada como residual

La inercia total de los datos de especies será la suma de los eigenvalues de los ejes restringidos y no restringidos

La explained inertia en relación a la total inertia puede ser usada como una medida de lo bien que la composición de las especies es explicada por las variables. Desgraciadamente, no existe una medida estricta de “bondad de ajuste” para CCA

Análisis de Ordenación: CCA

Biodiversidad y Conservación

Page 93: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

> summary(Ordination.model1, scaling=1)

cca(formula = Salabio ~ Hydrocarbons + Organic.matter + Sand, data = salfistan)

Partitioning of mean squared contingency coefficient:

Inertia Proportion

Total 2.185 1.0000

Constrained 1.072 0.4904

Unconstrained 1.114 0.5096

Eigenvalues, and their contribution to the mean squared contingency coefficient

Importance of components:

CCA1 CCA2 CCA3 CA1 CA2 CA3 CA4 CA5

Eigenvalue 0.6298 0.4009 0.04098 0.4575 0.2658 0.20995 0.14726 0.03302

Proportion Explained 0.2882 0.1835 0.01875 0.2093 0.1216 0.09608 0.06739 0.01511

Cumulative Proportion 0.2882 0.4717 0.49043 0.6998 0.8214 0.91750 0.98489 1.00000

Accumulated constrained eigenvalues

Importance of components:

CCA1 CCA2 CCA3

Eigenvalue 0.6298 0.4009 0.04098

Proportion Explained 0.5877 0.3741 0.03824

Cumulative Proportion 0.5877 0.9618 1.00000

Análisis de Ordenación: CCA

Biodiversidad y Conservación

Los eigenvalues y la proporción explicada se interpretan igual que en PCA. Normalmente, los dos primeros ejes absorben la mayor parte de la varianza

Page 94: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Scaling 1 for species and site scores

* Sites are scaled proportional to eigenvalues

* Species are unscaled: weighted dispersion equal on all dimensions

Species scores

CCA1 CCA2 CCA3 CA1 CA2 CA3

Laevicardium 0.33140 -0.58799 -0.05413 -0.29176 -1.8345683 2.319391

Modiolus 0.18991 -1.25322 -1.49657 -1.13511 2.7105300 -0.214338

Limatula 0.33140 -0.58799 -0.05413 -0.29176 -1.8345683 2.319391

Limea 0.33140 -0.58799 -0.05413 -0.29176 -1.8345683 2.319391

Myrtea 0.18991 -1.25322 -1.49657 -1.13511 2.7105300 -0.214338

Mysella -3.79042 -4.63579 1.70254 3.87084 0.0371673 -2.186763

Digitaria 0.31410 -0.68024 -0.72753 -0.45419 1.3706022 0.225604

Site scores (weighted averages of species scores)

CCA1 CCA2 CCA3 CA1 CA2 CA3

E1 -1.5570 1.5409 0.84327 -1.05385 0.6173535 -0.44010

E2 -1.8849 1.2482 -0.48796 -0.86307 -0.0010266 0.10436

E3 -1.8574 1.3418 -0.99015 -0.01563 -0.1467938 0.04983

E6 -1.8451 0.8667 -0.09443 -0.73982 -0.0001565 0.23103

E7 -3.5324 -2.9025 2.06496 2.61568 -0.0180753 -0.45128

E9 -0.1020 -0.2733 -0.45427 -0.51927 0.7205721 -0.04500

E11 0.3080 -0.1354 -0.03767 -0.16379 -0.5610316 -0.91231

E13 0.5511 0.5407 0.64427 1.02133 0.3172638 0.05880

E17 0.3881 -0.3164 -0.07121 -0.13347 -0.4877049 0.48695

Site constraints (linear combinations of constraining variables)

CCA1 CCA2 CCA3 CA1 CA2 CA3

E1 -0.2073 1.42932 0.255160 -1.05385 0.6173535 -0.44010

E2 -1.8472 1.12799 0.423186 -0.86307 -0.0010266 0.10436

E3 -1.9111 1.36942 -0.984381 -0.01563 -0.1467938 0.04983

E6 -2.2702 0.69307 0.451819 -0.73982 -0.0001565 0.23103

E7 -3.4279 -2.49784 0.109030 2.61568 -0.0180753 -0.45128

E9 0.1196 -0.50240 -0.061333 -0.51927 0.7205721 -0.04500

E11 0.3089 -0.01753 0.004606 -0.16379 -0.5610316 -0.91231

E13 0.4912 0.60037 0.057101 1.02133 0.3172638 0.05880

E17 0.2087 -0.23572 -0.002218 -0.13347 -0.4877049 0.48695

Biplot scores for constraining variables

CCA1 CCA2 CCA3 CA1 CA2 CA3

Hydrocarbons -0.6386 0.3130 -0.69574 0 0 0

Organic.matter -0.9509 -0.3702 0.02214 0 0 0

Sand 0.9699 -0.1648 -0.06017 0 0 0

Análisis de Ordenación: CCA

Biodiversidad y Conservación

Page 95: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

-8 -6 -4 -2 0 2 4

-6-4

-20

2

CCA1

CC

A2

++++

+

+

++

+

++

+ +

++

+

+

++++

++

++++

+

++

++

+

+

++

+

+++

+++

++

+ +++

++ +++

+

++

+

+

+

+

+

+

++

+

+

++++++

+

+

+

++++

+

+

+

+

+

+

+

+

+

+

+

++++

+

+

+

+

++

+

+

++

+

++

+

+

++

+

++

++

+++++

+++

+

+++

++++

+

+

++

+

Hydrocarbons

Organic.matterSand

E1E2E3

E6

E7

E9E11

E13

E17

Polydora_ho

-8 -6 -4 -2 0 2 4

-6-4

-20

2

CCA1

CC

A2

+

+

++

+

+

++

+

+

+

+ +

++

+

+

+

+++++

+++

+

+

++

++

+

+

++

+

+

++

+

++

++

+ +++

++ +

++

+

++

+

+

+

+

+

+

+

+

+

+

++

+

+++

+

+

+

++++

+

+

+

+

+

+

+

+

+

+

+

++++

+

+

+

+

++

+

+

++

+

++

+

+

++

+

+

+

+

+

+++++

+

++

+

+

++

++++

+

+

++

+

Hydrocarbons

Organic.matter

SandLaevicardium

Modiolus

LimatulaLimea

Myrtea

Mysella

DigitariaAstarte

Acanthocardia

Parvicardium

Cerastoderma

Spisula Tellina

DonaxPsammobia

Abra_alba

Chamelea

Clausinella

TimocleaGouldiaPitarDosiniaPaphia

CorbulaTellimyaThracia

Retusa

Hydrobia

BittiumTurbonilla

CyclopeBela

Lunatia

Gibberula

CaliptraeaLeptochiton

Chiton

Leptocheirus

CorophiumEricthonius

Siphonoecetes

Dexamine_spinDexamine

UrothoePhotis

LeucothoeHippomedonLepidepecreumPerioculoides

PontocratesPodoceridae Pariambus

PseudoliriusApseudes

Leptochelia

CirolanaPaguridae

Diogenes

Thia

Arabella

Capitella

Capitomastus

Notomastus

Cirratulus

Cirriformia_ten

Cirriformia

Cauleriella

DorvilleaOphryotrocha

Eunice_ha

Eunice_viLysidiceNematonereis

Glycera_ca

Glycera_tes

Glycera_tri

SyllidiaLumbrinerisEuclymene

Micromaldane

Nephthys

Hediste

Neanthes

Nereis

Platynereis

Hyalonoecia

Nainereis

Scolaricia

Paradoneis

Pectinaria

Anaitides

Eulalia_biEulalia_viGenetyllisHarmothoe

Amphiglena

Chone_co

Chone_in

Fabricia

JasmineiraAonides

Malacoceros

Pseudopolydora

Polydora_ci

Pseudomalacoceros

PygospioSpio

Eurysyllis

Eusyllis

Exogone_diExogone_he

Exogone_na

Exogone_ve

Ehlersia

Odontosyllis

Parapionosyllis_mi

Parapionosyllis_laPionosyllisPseudobrania_clPseudobrania_liSphaerosyllis_au

Sphaerosyllis_pi

Sphaerosyllis_caSphaerosyllis.hi

Sphaerosyllis_ta

Syllides

Syllis_arSyllis_gr

Syllis_hySyllis_prNicoleaPolycirrus

Thelepus

Amphipholis

AmphiuraPhascolion

Aspidosiphon

+

-EJE 1

EJE 2

Análisis de Ordenación: CCA

Biodiversidad y Conservación

Page 96: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

cor1<-cor(Salfis)

Oxygene Hydrocarbons Fats Phosphate Nitrogen Organic.matter Sand

Oxygene 1.0000000 -0.6962783 -0.69149675 -0.8886061 -0.4131979 -0.31181870 0.6235432

Hydrocarbons -0.6962783 1.0000000 0.89536238 0.9173309 0.4556640 0.37654830 -0.5572037

Fats -0.6914968 0.8953624 1.00000000 0.8383613 0.2271320 0.09314038 -0.4410749

Phosphate -0.8886061 0.9173309 0.83836126 1.0000000 0.4826282 0.35708163 -0.6204746

Nitrogen -0.4131979 0.4556640 0.22713203 0.4826282 1.0000000 0.95884007 -0.9387293

Organic.matter -0.3118187 0.3765483 0.09314038 0.3570816 0.9588401 1.00000000 -0.8721045

Sand 0.6235432 -0.5572037 -0.44107492 -0.6204746 -0.9387293 -0.87210449 1.0000000

Variables ambientales en CCA

El ruido en las abundancias de las especies no suele ser un problema en CCA (Palmer, 1993). Pero sípuede existir ruido en los datos ambientales. Este ruido puede afectar a los scores de las muestras al ser éstas combinaciones lineales, mientras que los scores de las especies son menos sensibles

Es recomendable eliminar aquellas variables altamente correlacionadas y aquellas que muestren colinealidad, es decir, cuando dos o más variables son una combinación de otra

Análisis de Ordenación: CCA

Biodiversidad y Conservación

Page 97: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Variables ambientales en CCA

> vif.cca (Ordination.model1)

Hydrocarbons Organic.matter Sand

1.980456 4.400896 6.018617

Factor de inflación de la varianza (VIF)como la relación entre la correlación múltiple R entre la variable ambiental j y las otras variables (VIF= 1/(1-R2

j)).

VIF >10: la variable está muy correlacionada con otras y dará lugar a coeficientes canónicos inestables y con escasa interpretación (algunos autores sitúan >20).

VIF normal: siempre mayor de 1.

VIF = 1: variables perfectamente independientes.

La elección de las variables es crucial en la realización del CCA. Variables con poca influencia darán lugar a resultados poco útiles

Las variables explicativas no tienen por que ser continuas, sino que CCA admite variables categóricas

OJO!! el análisis sólo admite un número máximo de variables inferior al número de muestras

Análisis de Ordenación: CCA

Biodiversidad y Conservación

Page 98: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Variables ambientales en CCA

> summary(Ordination.model1, scaling=1)

cca(formula = Salabio ~ Hydrocarbons + Organic.matter + Sand, data = salfistan)

Partitioning of mean squared contingency coefficient:

Inertia Proportion

Total 2.185 1.0000

Constrained 1.072 0.4904

Unconstrained 1.114 0.5096

Eigenvalues, and their contribution to the mean squared contingency coefficient

Importance of components:

CCA1 CCA2 CCA3 CA1 CA2 CA3 CA4 CA5

Eigenvalue 0.6298 0.4009 0.04098 0.4575 0.2658 0.20995 0.14726 0.03302

Proportion Explained 0.2882 0.1835 0.01875 0.2093 0.1216 0.09608 0.06739 0.01511

Cumulative Proportion 0.2882 0.4717 0.49043 0.6998 0.8214 0.91750 0.98489 1.00000

Estos ejes representan la variación residual. En algunos casos es posible que el primer eje residual tenga un eigenvalue más alto que el primer eje canónico. Estos ejes residuales son muy útiles en análisis exploratorios ya que pueden ofrecer pistas de que variables importantes se podrían estar perdiendo en el análisis

Si muchas variables son incluidas en el análisis, la mayoría de la inercia puede ser explicada. Esto es análogo a una regresión múltiple donde el r2 o varianza explicada aumenta con el número de variables incluidas. Cuando el número de variables se acerca al número de muestras, la inercia explicada se acerca a la inercia total y la solución del CCA se acerca a un análisis de correspondencias (CA). Es decir, la ordenación no está restringida por las variables. Es muy probable que el efecto arco aparezca con un número alto de variables, mientras que raramente aparece con pocas variables

Análisis de Ordenación: CCA

Biodiversidad y Conservación

Page 99: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Test de la hipótesis en CCA

> permutest(Ordination.model1, permutations=1000, first=T)

Permutation test for cca

Permutation: free

Number of permutations: 1000

Call: cca(formula = Salabio ~ Hydrocarbons + Organic.matter + Sand, data =salfistan)

Permutation test for first constrained eigenvalue

Pseudo-F: 2.827998 (with 1, 5 Degrees of Freedom)

Significance: 0.040959

> permutest(Ordination.model1, permutations=1000)

Permutation test for cca

Permutation: free

Number of permutations: 1000

Call: cca(formula = Salabio ~ Hydrocarbons + Organic.matter + Sand, data =salfistan)

Permutation test for all constrained eigenvalues

Pseudo-F: 1.604033 (with 3, 5 Degrees of Freedom)

Significance: 0.11688

Mediante test de aleatoriedad (randomization test) o test de Monte Carlo

El test para el primer eigenvalue determina si el primer eje del CCA es más fuerte que los valores esperados al azar

El test para la suma de todos los ejes canónicos determina si hay relación total entre especies y ambiente

Se recomiendan 1000 permutaciones para significancia de 0,05 y 5000 para 0,01

Análisis de Ordenación: CCA

Biodiversidad y Conservación

Page 100: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

-8 -6 -4 -2 0 2 4

-6-4

-20

24

CCA1

CC

A2 +

++++

+

++

+

++

+ +

++

+

+

++++++

++++

+

++

++

+

+

++

+

++

+

+++

++

+ +++

++ ++

++

++

+

+

+

+

+

+

++

+

+

++++++

+

+

+

+++

++

+

+

+

+

+

+

+

+

+

+

++++

+

+

+

+

++

+

+

++

+

++

+

+

++

+

++

++

+++++

+++

+

+++

++++

+

+

++

+

HydrocarbonsFats

Organic.matterSand

-10

1

E1E2E3E6

E7

E9E11E13

E17

-8 -6 -4 -2 0 2 4

-6-4

-20

24

CCA1

CC

A2 +

+++

+

+

++

+

++

+ +

++

+

+

++++

++

++++

+

+

+

++

+

+++

+

++

+

+++

++

+ +++

++ +

+++

++

++

+

++

+

++

+

+

+++

+++

+

+

+

+++

+

+

+

+

+

+

+

++

+

+

+

++++

+

+

+

+

++

+

+

++

+

++

+

+

+ +

+

++

++

+++

+ +

+++

+

++ +++++

+

+

++

+Oxygene

Hydrocarbons

Fats

NitrogenOrganic.matter

Sand

-10

1

E1E2E3E6

E7

E9E11E13

E17

-8 -6 -4 -2 0 2 4

-6-4

-20

2

CCA1

CC

A2 +

+++

+

+

++

+

++

++

++

+

+++++++ + ++

+

+

++

++

++

++

+

+

++

+

++

+

+

+ +++

++ +

++

+

+

++

+

+

++

+

++

+

+

++++

++

+

+

+++ +

+

+

+

+

+

+

++

+

+

+

+ ++++

+

+

+

+

++

+

+

++

+

+

+

+

+

++

+

++

++

+++

++

+ ++

+

+ ++

++++

+

+

+++ Oxygene

Hydrocarbons

FatsPhosphate

NitrogenOrganic.matter

Sand

-10

1

E1E2E3E6

E7

E9E11E13

E17

Análisis de Ordenación: CCA

Biodiversidad y Conservación

Otras configuraciones posibles con los datos pero no significativas. Es importante la selección correcta de variables para una interpretación fiable

Page 101: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Ejercicio 4: Efecto de la contaminación y el gradiente ambiental sobre la comunidad de invertebrados bentónicos en el estuario del río Odiel (Huelva). Se estudiaron 7 estaciones localizadas a lo largo del cauce principal desde Huelva (estación A) hasta la desembocadura en Mazagón (estación G) . Los datos consisten en 18 variables ambientales del sedimento y del agua de fondo y 51 familias de macrofauna del sedimento. Realizar CCA, previa transformación de la tabla biológica y estandarización de las variables ambientales. Obtener la ordenación con mejor ajuste según el test de Monte Carlo.

Archivos: odbio.txt y odfis.txt(Sánchez-Moyano et al 2010)

G

F

E

D

C

A

B

G

F

E

D

C

A

B

Análisis de Ordenación: CCA

Biodiversidad y Conservación

Page 102: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

BIBLIOGRAFÍA

Estacio, F., García-Adiego, E., Fa D., García-Gómez, J.C., Fa D., Daza, J.L., Hortas, F. & Gómez-Ariza, J.L., 1997. Ecological analysis in a polluted area of Algeciras Bay (Southern Spain): external vs. Internal outfalls andenvironmental implications. Marine Pollution Bulletin, 34 (10): 780-793

Bibliografía

Palmer, M.W.; http://ordination.okstate.edu/overview.htm

Biodiversidad y Conservación

ter Braak, C.J.F. & Smilauer, P. 1998. CANOCO reference manual and User's guide to Canoco for Windows: Software for Canonical Community Ordination (version 4). Microcomputer Power, Ithaca.

ter Braak, C.J.F., & Prentice, I.C. 1988. A theory of gradient analysis. Adv. Ecol. Res. 18:271-313

Mac Nally, R. & Timewell, C.A.R. 2005. Resource availability controls bird-assemblage composition throughinterspecific aggression. Auk 122: 1097-1 1 11

Palmer, M. W. 1986. Pattern in corticolous bryophyte communities of the North Carolina piedmont: Do mossessee the forest or the trees? Bryologist 89:59-65

Quinn, G.P. & Keough, M.J. 2001. Experimental design and data analysis for biologists. Cambridge UniversityPress

Kindt R & Coe R. 2005. Tree diversity analysis. A manual and software for common statistical methods forecological and biodiversity studies. Nairobi: World Agroforestry Centre (ICRAF).

Sánchez-Moyano, J.E., García-Asencio, I. & García Gómez, J.C. 2010. Spatial and temporal variation of the benthic macrofauna in a grossly polluted estuary from southwestern Spain. Helgoland Marine Research 64: 155-168

Page 103: Aproximación a R a través de análisis multivariantespersonales.us.es/jmguerra/r2.pdf · de trabajo e historial Área 4: Directorio de archivos, paquetes instalados, gráficos

Crawley, M.J. 2007. The R Book

R para Principiantes. (Emmanuel Paradis, 2003) http://cran.r-project.org/doc/contrib/rdebuts_es.pdf

Cayuela, L. 2011. Análisis multivariante en R. http://luiscayuela.blogspot.com.es/2009/05/cur.html

Bibliografía

Biodiversidad y Conservación

Introducción a R. (R Development Core Team, 2000) http://cran.r-project.org/doc/contrib/R-intro-1.1.0-espanol.1.pdf