Sei sulla pagina 1di 35

Teórica 7

Consensos

Soporte
Soporte de Bremer

Martín Ramírez, 2019. Curso de Sistemática Teórica, FCEyN – UBA


Consensos: Múltiples árboles óptimos

xread 'resoluciones' 13 11
12 345 678
A 0 0 0 0 0 00 000 000

B 1 1 0 0 0 10 000 000
C 1 1 0 0 0 11 000 000
D 1 1 0 0 0 01 000 000

E 1 0 1 0 1 00 000 110
F 1 0 1 0 1 00 000 100
G 1 0 1 0 1 00 000 ?11
H 1 0 1 0 1 00 000 001

I 1 0 1 1 0 00 101 000
J 1 0 1 1 0 00 110 000
K 1 0 1 1 0 00 011 000

proc/;

¿Cuántos árboles óptimos?


Matriz resoluciones.tnt
Múltiples árboles óptimos Resoluciones
D
xread 'resoluciones' 13 11 C
12 345 678 B
A 0 0 0 0 0 00 000 000 A B
D
D C
B 1 1 0 0 0 10 000 000 H
C F
C 1 1 0 0 0
D 1 1 0 0 0
11 000 000
01 000 000
x2 B
G
E
H
G
E 1 0 1 0 1 00 000 110 G H
F
F 1 0 1 0 1 00 000 100
x2 F E H
G 1 0 1 0 1 00 000 ?11
H 1 0 1 0 1 00 000 001
E G
F
K E
I 1 0 1 1 0 00 101 000 J Las tres
J 1 0 1 1 0 00 110 000 x3 I
K 1 0 1 1 0 00 011 000

proc/;

¿Cuántos árboles óptimos?


Consenso estricto

A
D
C
B H
G
F
E
K
J
I
Consenso estricto

12 árboles fundamentales
(12 resoluciones de 3 politomías,
2 x 2 x 3 = 12) Matriz resoluciones.tnt
Consenso estricto
D
C
B
A B
D
D C
H
C F
x2 G
B H
E
Politomías G
El consenso se lee como una G H
F
x2 F E
representación gráfica. E
H
G
F
K E
No necesariamente todas las J todas
resoluciones de las poliomías x3 I
serán óptimas.
Consenso estricto 12 resoluciones
2x2x3
En este caso, la representación gráfica sugiere 3x15x3 = 135
resoluciones, pero solamente 12 de ellas son óptimas
Consenso estricto
Schuh y Polhemus 1981
Consenso estricto. Sólo los grupos comunes a todos los árboles
óptimos (= “árboles fundamentales”) aparecen en el consenso

Ventajas
Interpretación simple y clara
Conservativo

Desventajas
Muy conservativo – Pero ver árboles podados

(Confusión de nombres. Por algún momento se confundieron los


consensos de Nelson con los estrictos. El de Nelson no lo vamos a ver,
no se usa)
Consensos

Resumen de los árboles óptimos


En general son una representación gráfica

Consenso de + 10.000 árboles


Ejemplo de Ramírez 2003
(Una selección de 21 árboles produce el
mismo consenso)
Mapeo de caracteres sobre consensos
Supongamos el siguiente caso: Dos resoluciones óptimas,
cuyo consenso tiene una politomía de cinco terminales
0
0
0
0
0 1
1
0
1
1 1 0
0
consenso 0
0 0 1
0 1 1 1
1 1
1
1
1
0 0 1
1
0
1. Al optimizar este consenso parece que hubiera una sinapomorfía que
no está en ninguno de los árboles fundamentales.
2. En el consenso, este carácter tiene 3 pasos, mientras que en los
árboles fundamentales tiene 1 o 2.
– Los consensos tienen igual o mayor longitud que los árboles fundamentales

Nixon y Carpenter 1996


¿Cómo hacemos listas de sinapomorfías en consensos?

Ojanguren y Ramírez 2009


Sinapomorfías en consensos

Método conservativo (implementado en TNT). Mostrar solamente las


sinapomorfías comunes a todas las resoluciones óptimas

1. Generar todas las resoluciones dicotómicas óptimas


2. Para cada rama, para cada resolución, calcular las listas de
sinapomorfías (no ambiguas)
3. Para cada rama del consenso estricto, la intersección de lo obtenido
en (2) contiene las sinapomorfías comunes a todas las resoluciones
Sinapomorfías en consensos

Car. 1 2 3 4 5 6 … etc
x 0 0 0 0 0 0 … Matriz y comandos
ambiguos.tnt
A 0 1 0 0 0 1 …
B 0 1 1 1 1 1 …
C 1 0 1 1 1 1 …
D 1 0 1 1 0 0 …
E 1 0 1 0 1 0 …

Supongamos que hubiera 2 árboles óptimos (determinados por el resto de la matriz):

a0 x (A (B (C (D E))))
a1 x (A (B (D (C E))))

Vamos a calcular la lista de sinapomorfías de cada grupo del consenso:


Sinapomorfías en consensos
Tree 1, char. 1 (1 steps)
Tree 0, char. 1 (1 steps)
x
Car. 1 2 3 4 5 6
x
0 A 0 A x 0 0 0 0 0 0
B B
C D A 0 1 0 0 0 1
1 E 1 E
D C
B 0 1 1 1 1 1
Tree 0, char. 2 (2 steps) Tree 1, char. 2 (2 steps) C 1 0 1 1 1 1
0 x 0 x
01 1 A 01 1 A D 1 0 1 1 0 0
1 B 1 B
C D
E 1 0 1 0 1 0
0 E 0 E
D C
Tree 0, char. 3 (1 steps) Tree 1, char. 3 (1 steps)
x x
0 A
B Optimizaciones 0 A
B
Optimizaciones
árbol 1
1 1
árbol 0
C D
E E
D C
Tree 0, char. 4 (2 steps) Tree 1, char. 4 (2 steps)
x x
0 A 0 A
B B
1 C 1 D
0 E 0 E
D C
Tree 0, char. 5 (2 steps) Tree 1, char. 5 (2 steps) Synapomorphies common to 2 trees
x x x
0 A 0 A
B 1 B
A
1 C 01 B
0 D
E E
0 D 1 3,4 4 E
C
Tree 0, char. 6 (2 steps) Tree 1, char. 6 (3 steps) 1 D
0 x 0 x C
01
Sinapomorfías comunes a
A 01 1 A
1 B 1 B
C
0
E
D
0
0
D
E árboles 1 y 2
1 C
Synapomorphies for tree 0 Synapomorphies for tree 1
x x
A
B Sinapomorfías A
B
Sinapomorfías
árbol 0 árbol 1
3,4,5 C 3,4 D
1 4 E 1 4 E
6
5 D C
Soporte: Las preguntas

¿Los resultados que obtuvimos están fuertemente / marginalmente


apoyados por los datos?

¿Qué clados están resueltos de manera más robusta, y cuáles son más
endebles?

Esta información se utiliza para tomar decisiones,


Taxonómicas / nomenclatoriales
De muestreo de terminales / grupos de caracteres / genes
Las complicaciones
A un análisis filogenético, se le agregan / quitan
Caracteres
Terminales
Se analizan otros genes por separado …
Casi siempre da algo un poco diferente
Los análisis filogenéticos reales raramente llegan a ser totalmente robustos

Generamos una matriz de datos al azar …


Obtenemos un árbol totalmente resuelto
La resolución (vs. politomías) no es un buen indicador de estructura filogenética

En todo análisis habrá grupos bien apoyados por los datos, y otros que no tanto
Es esperable que aparezcan algunos grupos espurios
Soporte de grupos

Soporte de grupos. Se trata de evaluar el soporte para cada grupo (rama) individual.
Medidas muy usadas, prácticamente obligatorias en muchas revistas.

Las medidas más comunes: Bootstrap y soporte de Bremer.


Longitud de ramas

Longitud de rama intuitivamente


relacionada al apoyo del grupo

Cantidad de cambios -- cantidad


de sinapomorfías

¿Qué tal cuando hilamos fino?

Bremer 1988
Longitud de ramas

Misma rama, distinta longitud según:


• Resolución (puede haber múltiples árboles óptimos)
• Reconstrucción (optimizaciones ambiguas: el largo de rama suele no estar definido)

Ramas colapsadas en el consenso (no apoyadas) pueden ser más largas que ramas
con apoyo

Bremer 1988
dos árboles
óptimos
Idea de Bremer: Consenso de subóptimos

Bremer 1988
Soporte de Bremer

Bremer 1988 (no le puso nombre)


“Bremer support” (Källersjö et al. 1992)
También conocido como “índice de decaimiento” (decay index)
Soporte de Bremer
¿Cuánto cuesta no tener el grupo ABC?

A B C A B C

Búsqueda del mejor árbol donde


5 ABC no sea monofilético

L = Largo óptimo = 32 L’ = Largo no ABC = 37

BSABC = L’ – L = 37 – 32 = 5

El soporte de Bremer de un grupo es el costo adicional que se genera al contradecirlo


Cuanto más soporte de Bremer, más apoyado está el grupo
Bremer 1988
Soporte de Bremer

Grupos colapsados en el consenso: BS = 0

Matrices sin homoplasia: BS = Largo de rama

Matrices con homoplasia: BS impredecible, interacciones complejas


Cálculo del soporte de Bremer: Estrategias

A. Árboles subóptimos.
B. Restricciones de no-monofilia (negative constraints).
Cálculo del soporte de Bremer: Subóptimos
A. Cálculo de BS buscando árboles subóptimos
Matriz original: Calcular largo óptimo y consenso estricto.
1. Si el grupo X no aparece en el consenso, BSX = 0
2. S = 1
a. Retener árboles subóptimos en S pasos
b. Calcular el consenso. Si se perdió el grupo Y, BSY = S
c. Si ya no hay grupos resueltos, FIN
d. S = S + 1, volver a (a)

Usando esta estrategia, qué valores de BS serán calculados con mayor


precisión, ¿los BS más bajos o más altos?
Estimación laboriosa pero bastante buena
Cálculo del soporte de Bremer: Aproximado con TBR
B. Estimación de BS mediante una ronda de TBR
Matriz original: Calcular largo óptimo y consenso estricto.
1. Si el grupo X no aparece en el consenso, BSX = 0
2. Realizar una ronda de TBR reteniendo los árboles subóptimos.
3. Ordenarlos por costo creciente y usar esos subóptimos para el
cálculo de suporte de Bremer

Es una estimación cruda pero rápida


Cálculo del soporte de Bremer: Restricciones

C. Cálculo de BS mediante restricciones de no-monofilia


Matriz original: Calcular largo óptimo (LO)y consenso estricto.
1. Si el grupo X no aparece en el consenso, BSX = 0
2. Para cada grupo Y del consenso, hacer:
a. Búsqueda del mejor árbol donde Y no sea monofilético. Calcular
el largo (Lno-Y). BSY = Lno-Y - LO
b. Volver a (a) hasta terminar con todos los grupos

Muy buena estimación, pero es lenta


Cálculo del soporte de Bremer: Estrategias
Los cálculos son heurísticos
Suele ser difícil calcular los BS, porque hay muchos árboles subóptimos

Supongamos que utilizamos las estrategias A, B y C.

Los soportes van a coincidir en general, pero puede haber leves diferencias
en algunos grupos.

¿Qué valores deberíamos usar?


Ventajas del soporte de Bremer

• Simple, intuitivo, fácil de calcular


• Tiene una relación directa con la optimalidad del análisis
• Medido en unidades de optimalidad (pesos iguales: pasos; pesos
implicados: ajuste o distorsión)
• No depende de caracteres individuales,
• ni de parámetros arbitrarios / continuos
Decisiones taxonómicas

BS
[remuestreo]
Ramírez 2003
Árboles dicotómicos o colapsados
Los árboles suelen colapsarse para evitar resoluciones sin soporte.
Por ejemplo:
x 0 0
y 1 0 Tres árboles dicotómicos, con las resoluciones: (A (B C)), (B (C A)), (C (BA)).
A 1 1 Ninguno de los grupos (B C) , … etc. tiene sinapomorfías
B 1 1 Un único árbol colapsado: (x (y (A B C)))
C 1 1

Para guardar menos árboles, más distintos entre sí, los programas sólo guardan árboles
que serían diferentes si se los colapsara.

Hay varias reglas de colapsado de grupos (Coddington y Scharff 1994).


Tres reglas simples para colapsado

Supongamos la siguiente matriz:

A 0 00000
B 1 00000 Tres árboles
C 1 00000 óptimos
D1 1 11111
D2 0 11111

Consenso
Tres reglas simples para colapsado
Pero ojo – 0 no homólogos??
No colapsar: Retener Colapsar rama si Colapsar rama si
todos los árboles largo máximo = 0 largo mínimo = 0
dicotómicos óptimos (Default en PAUP) (Default en TNT)

Aprovecha mejor el
buffer de árboles

col[; col 0; ie; map ./0; col[; col 1; ie; map ./0; col[; col 3; ie; map ./0;
Sub-árboles máximos (maximum agreement subtrees)
Gordon 1980
El mayor sub-árbol resuelto (maximum agreement subtree = largest common pruned
tree). Se eliminan terminales en posiciones ambiguas para ganar resolución. La
combinatoria es enorme, hay soluciones heurísiticas.

G
H
F
E
Habíamos visto: Sub-árbol
(H (F E)), con G
conectándose en dos lugares

Consenso
estricto

Sub-árbol
máximo
Swofford 1991
Árboles podados
xread 'flotante' 15 12

12 345 678 9 10
A 0 0 0 0 0 00 000 000 00
A
B 1 1 0 0 0 10 000 000 00 D
C 1 1 0 0 0 11 000 000 00 C
D 1 1 0 0 0 01 000 000 00 B
L
E 1 0 1 0 1 00 000 110 10 K
F 1 0 1 0 1 00 000 100 00 J
G 1 0 1 0 1 00 000 ?11 00 I
H 1 0 1 0 1 00 000 001 00 H
G
I 1 0 1 1 0 00 101 000 00 F
J 1 0 1 1 0 00 110 000 00 E
K 1 0 1 1 0 00 011 000 01
Consenso estricto
L 1 0 1 ? ? ?? ??? ??? 11

proc/;
¿Cómo lo podemos mejorar?
Matriz flotante.tnt
Árboles podados

Terminales o grupos “flotantes”

Pol y Escapa 2009


Consenso de mayoría
Consenso de mayoría. Los grupos que aparecen en más del 50% de los árboles
fundamentales aparecen en el consenso.

(A (B C)) + (A (B C)) + (B (A C)) = (A (B C))

Utilizado para medidas de soporte de grupos basadas en remuestreos y para análisis


bayesiano (ya lo veremos)

Usualmente se indican las frecuencias sobre las ramas (50% < F  100%)

Potrebbero piacerti anche