técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis
DESCRIPTION
Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis. b. a. a. b. b. a. c. c. c. Técnicas multivariantes:. muestras. a. especies. ordenación. matriz triangular de similitudes. a. a. b. b. - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis](https://reader035.vdocuments.co/reader035/viewer/2022062408/56813dea550346895da7c379/html5/thumbnails/1.jpg)
Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis
![Page 2: Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis](https://reader035.vdocuments.co/reader035/viewer/2022062408/56813dea550346895da7c379/html5/thumbnails/2.jpg)
Técnicas multivariantes:
muestras
espe
cies
matriz triangular de similitudes
aaa
bb
b
cc
c
ordenación
2
clasificación
a
a
a
b
b
cOrdenación y clasificación Ordenación y clasificación son formas de explorar/visualizar las relaciones de similitud entre muestras/tratamientos/factores
![Page 3: Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis](https://reader035.vdocuments.co/reader035/viewer/2022062408/56813dea550346895da7c379/html5/thumbnails/3.jpg)
3
Clasificación (análisis clúster)
![Page 4: Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis](https://reader035.vdocuments.co/reader035/viewer/2022062408/56813dea550346895da7c379/html5/thumbnails/4.jpg)
4
Clasificación (análisis clúster)
Técnicas para agrupar/separar grupos de objetos (e.g. muestras/especies) “en paquetes” basadas en su similitud (se basan en índices de similitud)
Genera en dendograma basado en una clasificación generalmente jerárquica: pequeños grupos de objetos (p.e. muestras/especies) dentro de grupos mayores y estos a su vez dentro de grupos mayores; y aglomerativa: se parte de tantas clases como objetos tengamos que clasificar y en pasos sucesivos vamos obteniendo clases de objetos similares
![Page 5: Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis](https://reader035.vdocuments.co/reader035/viewer/2022062408/56813dea550346895da7c379/html5/thumbnails/5.jpg)
5Diseño experimental y análisis estadístico: su aplicación en biología marina
Clasificación: un ejemplo
![Page 6: Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis](https://reader035.vdocuments.co/reader035/viewer/2022062408/56813dea550346895da7c379/html5/thumbnails/6.jpg)
"The availability of computer packages of classification techniques has led to the waste of more valuable scientific time than any other statistical innovation (with the possible exception of multiple regression techniques)." Cormack (1971) A review of classification. Journal of the Royal Statistical Society A 134, 321-367.
No sólo depende del tipo de distancia que seleccionemos, sino tb de las muchos estrategias para construir el dendograma. Y hay muchísimas¡
Clasificación: ¿merece la pena?
Diseño experimental y análisis estadístico: su aplicación en biología marina
Escepticismo respecto a la clasificación
![Page 7: Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis](https://reader035.vdocuments.co/reader035/viewer/2022062408/56813dea550346895da7c379/html5/thumbnails/7.jpg)
D C B A B A D C
Un dendograma pueden ser re-estructurado alrededor de cualquier intersección/nodo y objetos que aparecían distantes pueden aparecer cerca
Diseño experimental y análisis estadístico: su aplicación en biología marina
En estudios de ecología la mejor clasificación es una ordenación
![Page 8: Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis](https://reader035.vdocuments.co/reader035/viewer/2022062408/56813dea550346895da7c379/html5/thumbnails/8.jpg)
8
PCA/MDS/cluster son técnicas de visualización de patrones: no permite contraste de hipótesis
Necesidad de un test para contrastar las diferencias entre grupos que acompañe a una técnica de visualización de patrones
Rutina ANOSIM
![Page 9: Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis](https://reader035.vdocuments.co/reader035/viewer/2022062408/56813dea550346895da7c379/html5/thumbnails/9.jpg)
Ho = tratamientos son igualesHa = tratamientos NO son iguales
Tratamiento 1Tratamiento 2
9
Por ejemplo, ¿diferencias entre tratamientos 1 y 2?
![Page 10: Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis](https://reader035.vdocuments.co/reader035/viewer/2022062408/56813dea550346895da7c379/html5/thumbnails/10.jpg)
Ho = verdad
variabilidad entre tratamientos = o < variabilidad dentro de cada tratamiento
10
![Page 11: Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis](https://reader035.vdocuments.co/reader035/viewer/2022062408/56813dea550346895da7c379/html5/thumbnails/11.jpg)
variabilidad dentro de tratamientos < variabilidad entre tratamientos
11
Ha = verdad
Diseño experimental y análisis estadístico: su aplicación en biología marina
![Page 12: Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis](https://reader035.vdocuments.co/reader035/viewer/2022062408/56813dea550346895da7c379/html5/thumbnails/12.jpg)
ANOSIM
12
![Page 13: Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis](https://reader035.vdocuments.co/reader035/viewer/2022062408/56813dea550346895da7c379/html5/thumbnails/13.jpg)
13
ANOSIM
Técnica de contraste hipotético que proporciona un p-valor para contrastar la hipótesis:
Ho = tratamientos son iguales
Ha = tratamientos NO son iguales
Podemos ejecutar tantos contraste como pares de niveles queramos contrastar. Obtengo un estadístico (R) y lo importante: un p-valor asociado
![Page 14: Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis](https://reader035.vdocuments.co/reader035/viewer/2022062408/56813dea550346895da7c379/html5/thumbnails/14.jpg)
Rutina BIOENV (regresión múltiple multivariante)
14
![Page 15: Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis](https://reader035.vdocuments.co/reader035/viewer/2022062408/56813dea550346895da7c379/html5/thumbnails/15.jpg)
15
BIOENV
Análisis directo de gradientes: explicar la variabilidad de la matriz Y (biótica) en términos de variables predictoras “Xs” (abiótica)
A B réplica sp 1 sp 2 sp 3 sp 4 sp 5 sp n
A1 B1 1 … … … … … …
A1 B1 2 … … … … … …
A1 B2 1 … … … … … …
A1 B2 2 … … … … … …
A1 B3 1 … … … … … …
A1 B3 1 … … … … … …
A2 B1 1 … … … … … …
A2 B1 2 … … … … … …
A2 B2 1 … … … … … …
A2 B2 2 … … … … … …
A2 B3 1 … … … … … …
A2 B3 2 … … … … … …
A B réplica V 1 V 2 V 3 V 4
A1 B1 1 … … … …
A1 B1 2 … … … …
A1 B2 1 … … … …
A1 B2 2 … … … …
A1 B3 1 … … … …
A1 B3 1 … … … …
A2 B1 1 … … … …
A2 B1 2 … … … …
A2 B2 1 … … … …
A2 B2 2 … … … …
A2 B3 1 … … … …
A2 B3 2 … … … …
Y (matriz biótica) X (matriz abiótica)
![Page 16: Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis](https://reader035.vdocuments.co/reader035/viewer/2022062408/56813dea550346895da7c379/html5/thumbnails/16.jpg)
16
Problema: colinealidad; muchas X están correlacionadas. Por ello, uso RDA siempre en combinación la regresión multivariante múltiple para seleccionar las X apropiadas (rutina/freeware DISTLM que veremos en las prácticas) = buscar el modelo con mayor “parsimonia”
RDA: cómo actúa
![Page 17: Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis](https://reader035.vdocuments.co/reader035/viewer/2022062408/56813dea550346895da7c379/html5/thumbnails/17.jpg)
Diseño experimental y análisis estadístico: su aplicación en biología marina17
Técnicas multivariantes: resumiendo
![Page 18: Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis](https://reader035.vdocuments.co/reader035/viewer/2022062408/56813dea550346895da7c379/html5/thumbnails/18.jpg)
Variables (muestras)
Ob
jeto
s (e
spec
ies)
matriz triangular de similitudes
aaa
bb
b
cc
c
ordenación
18
clasificación
a
a
a
b
b
c
![Page 19: Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis](https://reader035.vdocuments.co/reader035/viewer/2022062408/56813dea550346895da7c379/html5/thumbnails/19.jpg)
19
Similitudes Objetivo/casos tipo
PCA Distancia euclidiana(asumo relación lineal entre variables y ejes)
Visualización de diferencias entre muestras/tratamientos usando variables abióticas/ambientales. Puedo saber el % de
variabilidad explicada por cada eje (componente)
nm-MDS
Cualesquiera (no asumo relación
lineal); trabajo con rangos
Visualización de diferencias entre muestras/tratamientos usando matrices bióticas: respuestas a nivel de comunidad
(datos se “portan muy mal”)
Ordenación: casos tipo y sus diferencias
![Page 20: Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis](https://reader035.vdocuments.co/reader035/viewer/2022062408/56813dea550346895da7c379/html5/thumbnails/20.jpg)
20
PCA, nm-MDS, análisis indirecto de gradientes
BIOENV – análisis directo de gradientes
Test = ANOSIM
Test = reg. múltiple Multivariante
Ordenación: casos tipo y sus tests de contraste