Cosa indicano i valori di bootstrap riguardo alla relazione tra le specie? Sto lavorando al programma Mega ma non capisco cosa significhi il valore di bootstrap in termini semplici e anche cosa indichi sulla relazione tra le specie
Commenti
- Benvenuto in Biology.SE! Quali ricerche hai fatto prima di chiederlo qui?
Risposta
I valori di bootstrap appartengono a unampia categoria di valori denominati valori di supporto . I valori di supporto in generale vengono utilizzati per dare qualche indicazione di il grado in cui si può essere certi che il ramo rappresenti un qualche “segnale” presente nei dati.
In particolare, i valori di bootstrap indicano come robusto i rami dellalbero sono, ovvero quanto sono resistenti alla perturbazione nei dati. Sono ottenuti ricampionando colonne nella matrice dati, costruendo alberi da tali ricampionati matrici e guardando la proporzione del risultato alberi che contengono un dato ramo.
Nel caso di bootstrap, la fase di ricampionamento viene eseguita nel modo seguente: Supponiamo che la matrice di dati originale abbia N colonne (ad es. N caratteri codificati, che possono essere nucleotidi o amminoacidi in un allineamento di sequenza, caratteri morfologici, presenza-assenza di caratteristiche genomiche, ecc.). Una nuova matrice sarà ottenuta disegnando a caso una di queste colonne, N volte. La nuova matrice avrà quindi lo stesso numero di caratteri, ma alcuni della matrice originale saranno presenti più volte e alcuni saranno assenti. Ciò influenzerà la topologia dellalbero. Ad esempio, se un ramo era supportato da caratteri che ora sono assenti, questo ramo potrebbe non apparire più con questo particolare ricampionamento. Il ricampionamento viene solitamente eseguito circa 100 o 1000 volte.
Un valore di bootstrap basso significa che se lalbero è costruito utilizzando un sottoinsieme di dati, è probabile che questo ramo non venga visualizzato.
Un valore di bootstrap alto significa che il ramo apparirà probabilmente su un albero costruito da una tale matrice ricampionata. Ciò non significa necessariamente che è più probabile che il ramo rappresenti le vere relazioni storiche, tuttavia: a volte, gli artefatti della ricostruzione possono essere robusti. Ad esempio, con alcuni metodi di ricostruzione della filogenesi molecolare, i taxa possono finire per essere raggruppati in base alle somiglianze nella composizione del genoma. Valori di bootstrap alti indicano che cè un segnale forte nei dati che supportano il ramo, sia esso storico o altro.
re-sampling columns in the data matrix
. Significa sottosistemare gli SNP sequenziati, o gli individui disponibili, o qualche altra statistica pre-elaborata, ecc …?