Vad anger bootstrap-värdena om förhållandet mellan arten? Jag jobbar med Mega-programmet men jag förstår inte vad bootstrap-värde betyder i enkla termer och också vad betyder det om förhållandet mellan arter
Kommentarer
- Välkommen till Biology.SE! Vilken forskning har du gjort innan du frågade om det här?
Svar
Bootstrap-värdena tillhör en bred kategori av värden som heter supportvärden . Stödvärden i allmänhet används för att ge en viss indikation på i vilken grad man kan vara säker på att grenen representerar någon ”signal” som finns i data.
I synnerhet anger bootstrap-värden hur robust grenarna i trädet är, det vill säga hur motståndskraftiga de är för störning i data. De erhålls genom att åter sampla kolumner i datamatrisen, bygga träd från sådan omprovtagning matriser och titta på andelen erhållen träd som innehåller en viss gren.
När det gäller bootstrap görs omprovningssteget på följande sätt: Antag att den ursprungliga datamatrisen har N-kolumner (dvs. N-kodade tecken, som kan vara nukleotider eller aminosyror i en sekvensinriktning, morfologiska tecken, närvaro-frånvaro av genomiska egenskaper, etc.). En ny matris erhålls genom att slumpmässigt rita en av dessa kolumner, N gånger. Den nya matrisen kommer därför att ha samma antal tecken, men en del från den ursprungliga matrisen kommer att finnas flera gånger och andra saknas. Detta kommer att påverka trädets topologi. Till exempel, om en gren stöddes av tecken som nu saknas, kanske den här grenen inte visas längre med den här omprovtagningen. Omprovtagningen görs vanligtvis cirka 100 eller 1000 gånger.
Ett lågt bootstrapvärde betyder att om trädet byggs med en delmängd av data är det troligt att denna gren inte kommer att visas.
Ett högt bootstrapvärde innebär att grenen sannolikt kommer att visas på ett träd byggt från en sådan samplad matris. Detta betyder inte nödvändigtvis att filialen är mer benägna att representera de sanna historiska förhållandena, men ibland kan rekonstruktionsartefakter vara robusta. Till exempel, med vissa molekylära fylogeni-rekonstruktionsmetoder kan taxa sluta grupperas baserat på likheter i genomkomposition. Höga bootstrap-värden indikerar att det finns en stark signal i data som stöder filialen, vare sig det är historisk signal eller annat.
Kommentarer
- Snyggt svar + 1. Har du något emot att klargöra hur vi samplar igen. Att bara förklara hur data är organiserade i matrisen kan hjälpa till att klargöra vad
re-sampling columns in the data matrix
verkligen betyder. Betyder det underdelning av SNP-sekvenser, eller tillgängliga individer, eller någon annan förbehandlad statistik, etc …? - @ Remi.b Jag försökte utöka mitt svar lite. Detta är omprovtagning av tecken (konventionellt kodade som kolumner), inte individer (konventionellt kodade som rader). Observera att omprovtagning av individer skulle leda till träd på olika uppsättningar taxa, och det skulle därför vara omöjligt att helt enkelt jämföra grenar mellan träd och beräkna grenstödvärden.
- @ Remi.b Om du kan läsa Franska och är intresserade av dessa stödvärden, kanske du tittar på introduktionen av min avhandling (sidorna 9 och 10 i tel.archives-ouvertes.fr/tel-00331825 ). Jag ser att jag nämnde " störningar de l é chantillonnage taxinomique " på sätt som mäta robusthet, men jag kan ' inte komma ihåg vad jag tänkte …
- Wow jag visste inte att folk fortfarande skriver doktorsavhandling på franska! Det känns som en smärta att behöva översätta dina publikationer från engelska till franska bara för avhandlingen. Ja, jag kan läsa franska. Tack för länken.
- I Frankrike tycker jag att det fortfarande är ganska vanligt att skriva avhandlingar på franska (särskilt inom humaniora, men inte bara). Avhandlingens huvudtext skrevs på franska, men artiklarna ingick som de är på engelska. Jag ' är glad att jag kunde skriva på mitt modersmål: det gjorde upplevelsen mycket roligare.