WAGNERLINNEO
MÉTODOS DE BÚSQUEDA DE
ARBOLES Y OPTIMIZACIÓN
Optimización de CaracteresOptimización de Caracteres
*
paralelismo 2 orígenes independientes 0 => 1 (DELTRAN)
origenyreversión(ACCTRAN)
0 0 1 1 0
A B C D E
*
0 => 1
==
1 => 0
Búsqueda de arboles óptimosBúsqueda de arboles óptimos: : Soluciones exactasSoluciones exactas
Soluciones exactas solo pueden ser Soluciones exactas solo pueden ser usadas para un pequeño número de usadas para un pequeño número de taxa.taxa.
Búsqueda exhaustiva examina todos Búsqueda exhaustiva examina todos los arboles posibles. los arboles posibles.
Típicamente usados para grupos Típicamente usados para grupos problemas menores a 10 OTUsproblemas menores a 10 OTUs..
Búsqueda exhaustivaBúsqueda exhaustiva
A
B C
1
2a
Arbol de partida, 3 taxa
A
B D
C
A
BD C
A
B C
D2b 2c
E
E
EE
E
Añada un cuarto taxón (D) en cada una de los tres combinaciones posibles -> tres árboles
Añada un quinto taxon (E) en cada una de las cinco posibles posiciones en cada uno de los tres arboles -> 15 arboles……….
Hay tres posibles arboles no enraizados Hay tres posibles arboles no enraizados para cuatro taxa (para cuatro taxa (AA, , BB, , CC, , DD))
A C
B D
Arbol 1
A B
C D
Arbol 2
A B
D C
Arbol 3
Inferencia Filogenética:
Búsqueda del “arbol verdadero o único”
Computacionalmente intensivo ( “hard problem”)
Número de árboles incrementa de manera exponencial con el numero de taxa
(2N - 5)!! = # arboles no enraizados para N taxa
CA
B D
A B
C
A D
B E
C
A D
B E
C
F
Búsqueda de arboles óptimos: Búsqueda de arboles óptimos: Soluciones exactasSoluciones exactas
Branch and bound Branch and bound ahorra tiempo ahorra tiempo descartando familias de arboles durante la descartando familias de arboles durante la construcción del arbol. Elimina aquellos construcción del arbol. Elimina aquellos combinaciones que involucran un mayor combinaciones que involucran un mayor numero de pasos.numero de pasos.
Típicamente usado en problemas que Típicamente usado en problemas que involucran menos de 18 taxainvolucran menos de 18 taxa..
A
B C
B1
A
B D
C
A
B C
D
B3
A1
A
B E
D
CC1.1
A
B D
E
CC1.3
A
B D
C
EC1.2
A
B
CC1.4
E D
A
B C
C1.5
ED
A
BD C
B2
C2.1
C2.2
C2.3
C2.4
C2.5
C3.1
C3.2
C3.3
C3.4
C3.5
Búsqueda de arboles óptimos: Soluciones Búsqueda de arboles óptimos: Soluciones exactas: Branch and Bound exactas: Branch and Bound
E
E
E
EE
Búsqueda de arboles óptimos: Búsqueda de arboles óptimos: Búsqueda heurísticaBúsqueda heurística
Métodos heurísticos son usados para buscar en el Métodos heurísticos son usados para buscar en el espacio de arboles aquél más parsimonioso espacio de arboles aquél más parsimonioso seleccionando un árbol inicial e intercambiando ramas seleccionando un árbol inicial e intercambiando ramas buscando las mejores combinaciones. buscando las mejores combinaciones.
Problema: “No garantiza encontrar el más Problema: “No garantiza encontrar el más parsimonioso” (“se hace lo que se puede").parsimonioso” (“se hace lo que se puede").
Búsqueda de arboles óptimos: Búsqueda Búsqueda de arboles óptimos: Búsqueda heurísticaheurística
Stepwise additionStepwise addition AsisAsis – – El orden en la matriz de datosEl orden en la matriz de datos.. ClosestClosest – –Comienza con el árbol más corto deComienza con el árbol más corto de 3-taxa añadiendo otros taxa en un orden que 3-taxa añadiendo otros taxa en un orden que
produce el menor incremento en el largo del produce el menor incremento en el largo del árbol.árbol.
SimpleSimple – – El primer taxón en la matriz es tomado El primer taxón en la matriz es tomado como referencia (taxa son añadidos considerando como referencia (taxa son añadidos considerando un orden decreciente de similaridad a la un orden decreciente de similaridad a la referencia).referencia).
RandomRandom - - taxa son añadidos en una secuencia al taxa son añadidos en una secuencia al azar, muchas secuencias distintas son usadas. azar, muchas secuencias distintas son usadas. Se recomienda usar Random cuando son muchas Se recomienda usar Random cuando son muchas OTUs (10-100).OTUs (10-100).
Búsqueda heurísticaBúsqueda heurística
Branch Swapping (intercambiando Branch Swapping (intercambiando ramas):ramas):
Nearest neighbor interchange (NNI)Nearest neighbor interchange (NNI) Subtree pruning and regrafting Subtree pruning and regrafting
(SPR) (corte e injerto)(SPR) (corte e injerto) Tree bisection and reconnection Tree bisection and reconnection
(TBR)(TBR)
Búsqueda heurísticaBúsqueda heurística
Nearest neighbor interchange (NNI)Nearest neighbor interchange (NNI)
A
B
C DE
F
G
A
B
D CE
F
G
A
B
C D
E
F
G
Búsqueda heurísticaBúsqueda heurística
Subtree pruning and regrafting (SPR)Subtree pruning and regrafting (SPR)
A
B
C DE
F
G
A
B
C DE
F
G
C
D
G
B
A
E F
(corte e injerto)(corte e injerto)
PAUP permite 2 cortesPAUP permite 2 cortesNONA hasta 10 cortesNONA hasta 10 cortes
Búsqueda heurísticaBúsqueda heurística
Tree bisection and reconnection (TBR)Tree bisection and reconnection (TBR)
A
B
C DE
F
G
A
B
CD
E
F
G
A
C
F
D
E
B G
PAUP permite 2 cortesPAUP permite 2 cortesNONA hasta 10 cortesNONA hasta 10 cortes
Búsqueda heurísticaBúsqueda heurística Branch SwappingBranch Swapping Nearest neighbor interchange (NNI)Nearest neighbor interchange (NNI) Subtree pruning and regrafting (SPR)Subtree pruning and regrafting (SPR) Tree bisection and reconnection (TBR)Tree bisection and reconnection (TBR) Por la naturaleza de búsqueda heurística no Por la naturaleza de búsqueda heurística no
podemos saber cual método es mejor..es decir podemos saber cual método es mejor..es decir cual método encontrará el árbol más cual método encontrará el árbol más parsimonioso ( o los arboles MP). parsimonioso ( o los arboles MP).
Consejo, TBR ( el más intensivo) usada junto con Consejo, TBR ( el más intensivo) usada junto con Random addition debería funcionar mejor.Random addition debería funcionar mejor.
El Espacio de arboles puede ser “habitado” por minimos El Espacio de arboles puede ser “habitado” por minimos locales e islas de arboleslocales e islas de arboles
MÍNIMO LOCAL
Largodelárbol
SECUENCIA DE RÉPLICAS DE RANDOM ADDITION
CORRECTAEQUIVOCA EQUIVOCA
Branch SwappingBranch Swapping
Branch Swapping
MÍNIMOGLOBAL
MÍNIMO LOCAL
BUSCANDO CON RESTRICCIONES BUSCANDO CON RESTRICCIONES TOPOLOGICAS (topological constraints)TOPOLOGICAS (topological constraints)
““Topological constraints” son hipótesis filogenéticas Topological constraints” son hipótesis filogenéticas definidas por el usuario.definidas por el usuario.
Pueden ser usadas para encontrar arboles óptimos Pueden ser usadas para encontrar arboles óptimos cuando:cuando:
1. Se incluye un clado específico o un set de 1. Se incluye un clado específico o un set de relaciones específicas.relaciones específicas.
2. Se excluye un clado especifico o un set de 2. Se excluye un clado especifico o un set de relaciones específicas. (reverse constraint)relaciones específicas. (reverse constraint)
Buscando usando “topological Buscando usando “topological constraints”constraints”
A B C D E F G
ABCDEFG
((A,B,C,D)(E,F,G))
A B C D E F G
ABCDEFG
A B C E D F G
Compatible con constraint tree
CONSTRAINT TREE
Incompatible con reverse constraint tree
Compatible con reverse constraint treeIncompatible con constraint tree
Buscando usando “topological Buscando usando “topological constraints” constraints”
“backbone constraints”“backbone constraints” ““Backbone constraints” especifica relaciones entre un subgrupo de taxaBackbone constraints” especifica relaciones entre un subgrupo de taxa
A B D E
A B D E
A D B E
Posiciones posibles de taxon CCompatible con backbone constraintIncompatible con reverse constraint
Incompatible con backbone constraintCompatible con reverse constraint
BACKBONE CONSTRAINT((A,B)(D,E))
Relaciones de taxon C no son especificadas
Datos faltantes (“missing data”)Datos faltantes (“missing data”) ““Missing data” son ignorados en la construcción de un árbol pero pueden Missing data” son ignorados en la construcción de un árbol pero pueden
llevar, si son incluidos a encontrar arboles igualmente parsimoniosos, en llevar, si son incluidos a encontrar arboles igualmente parsimoniosos, en ausencia de homoplasía. ausencia de homoplasía.
A B C D E
**
Origen único0 => 1En cualquierade las tres ramas
1 ? ? 0 0
*
Muchos datos faltantes en la matriz pueden llevar a multiples arboles igualmente parsimoniosos. (Problema más serio cuando se analizan datos morfológicos que datos moleculares)
Arboles OptimosArboles Optimos
La mayoría de los métodos nos llevan La mayoría de los métodos nos llevan a encontrar múltiples árboles a encontrar múltiples árboles igualmente parsimoniosos .igualmente parsimoniosos .
Podemos seleccionar entre ellos Podemos seleccionar entre ellos usando criterios adicionales…. usando criterios adicionales….
Es una práctica común utilizar árboles Es una práctica común utilizar árboles de consenso.de consenso.
Métodos de ConsensoMétodos de Consenso
Arbol de Consenso: resumen del acuerdo Arbol de Consenso: resumen del acuerdo entre los arboles encontrados. entre los arboles encontrados.
Los Métodos de Consenso puedens ser Los Métodos de Consenso puedens ser usados en:usados en:
a) Múltiples arboles de un análisis.a) Múltiples arboles de un análisis.
b) Múltiples análisisb) Múltiples análisis
SUPERTREES (debate!!)SUPERTREES (debate!!)
Método de Consenso EstrictoMétodo de Consenso Estricto
A B C D E F G A B C E D F G
A B C D E F G
Método de Consenso de MayoríaMétodo de Consenso de Mayoría
A B C D E F G A B C E D F G
A B C E D F G
A B C E F D G
100
66
66
66
66
Método de Consenso reducido Método de Consenso reducido (Reduced consensus)(Reduced consensus)
A B C D E F G
STRICT REDUCED CONSENSUS TREE Taxon G es excluído
A G B C D E F
A B C D E F
A B C D E F G
Consenso Estricto NO Resuelve
ProgramaPrograma
RadConRadCon
Método de ConsensoMétodo de Consenso Use Consenso Estricto para identificar aquellas Use Consenso Estricto para identificar aquellas
relaciones que se sostiene en forma inambigua relaciones que se sostiene en forma inambigua para una interpretación por parsimonia de los para una interpretación por parsimonia de los datos. datos.
Use Métodos del Consenso Reducido donde Use Métodos del Consenso Reducido donde arboles de consenso tiene poca resolución.arboles de consenso tiene poca resolución.
Use Método de mayoría cuando haga bootstrapsUse Método de mayoría cuando haga bootstraps..