Hva indikerer bootstrap-verdiene om forholdet mellom arten? Jeg jobber med Mega-program, men jeg forstår ikke hva bootstrap-verdien betyr i enkle termer, og også hva betyr det om forholdet mellom arter
Kommentarer
- Velkommen til Biology.SE! Hvilken forskning har du gjort før du spurte om det her?
Svar
Bootstrap-verdiene tilhører en bred verdikategori kalt støtteverdier . Støtteverdier generelt brukes for å gi noen indikasjoner på i hvilken grad man kan være trygg på at grenen representerer noe «signal» som er tilstede i dataene.
Spesielt indikerer bootstrap-verdier hvordan robust grenene i treet er, det vil si hvor motstandsdyktige de er mot forstyrrelse i dataene. De oppnås ved å re-sample kolonner i datamatrisen, bygge trær fra slik re-samplet matriser, og se på andelen oppnådd trær som inneholder en gitt gren.
Når det gjelder bootstrap, gjøres prøvetakingstrinnet på følgende måte: Anta at den opprinnelige datamatrisen har N-kolonner (dvs. N-kodede tegn, som kan være nukleotider eller aminosyrer i en sekvensjustering, morfologiske tegn, tilstedeværelse-fravær av genomiske egenskaper, etc.). En ny matrise vil bli oppnådd ved å tilfeldig tegne en av disse kolonnene, N ganger. Den nye matrisen vil derfor ha samme antall tegn, men noen fra den opprinnelige matrisen vil være til stede flere ganger, og noen vil være fraværende. Dette vil påvirke topologien til treet. For eksempel, hvis en gren ble støttet av tegn som nå er fraværende, kan det hende at denne grenen ikke vises lenger med denne spesielle samplingen. Re-sampling gjøres vanligvis rundt 100 eller 1000 ganger.
En lav bootstrap-verdi betyr at hvis treet er bygget ved hjelp av en delmengde av dataene, er det sannsynlig at denne grenen ikke vises.
En høy bootstrap-verdi betyr at grenen sannsynligvis vil vises på et tre bygget fra en slik samplet matrise. Dette betyr ikke nødvendigvis at grenen mer sannsynlig representerer de sanne historiske forhold, men noen ganger kan gjenoppbyggingsgjenstander være robuste. For eksempel, med noen molekylære fylogeni-rekonstruksjonsmetoder, kan taxa ende opp med å bli gruppert basert på likheter i genomssammensetning. Høye bootstrap-verdier indikerer at det er et sterkt signal i dataene som støtter grenen, det være seg historisk signal eller annet.
Kommentarer
- Fint svar + 1. Har du noe imot å avklare hvordan vi prøver på nytt. Bare å forklare hvordan dataene er organisert i matrisen, kan bidra til å avklare hva
re-sampling columns in the data matrix
egentlig betyr. Betyr det å underinnstille SNP-sekvensene, eller individene som er tilgjengelige, eller annen forhåndsbehandlet statistikk, etc …? - @ Remi.b Jeg prøvde å utvide svaret mitt litt. Dette er prøvetaking av tegn (konvensjonelt kodet som kolonner), ikke enkeltpersoner (konvensjonelt kodet som linjer). Merk at omprøving av individer vil føre til trær på forskjellige sett med takster, og det ville derfor være umulig å bare sammenligne grener mellom trær og beregne grenstøtteverdier.
- @ Remi.b Hvis du kan lese Fransk og er interessert i disse støtteverdiene, kan du ta en titt på introduksjonen av avhandlingen min (side 9 og 10 i tel.archives-ouvertes.fr/tel-00331825 ). Jeg ser at jeg nevnte " perturbations de l é chantillonnage taxinomique " på måter måle robusthet, men jeg kan ' ikke huske hva jeg hadde i tankene …
- Wow jeg visste ikke at folk fremdeles skriver doktorgradsavhandling på fransk! Det føles som en smerte å måtte oversette publikasjonene dine fra engelsk til fransk bare for oppgaven. Ja, jeg kan lese fransk. Takk for lenken.
- I Frankrike tror jeg det fortsatt er ganske vanlig å skrive teser på fransk (spesielt innen humaniora, men ikke bare). Oppgavens hovedtekst ble skrevet på fransk, men artiklene ble inkludert som de er på engelsk. Jeg ' er glad for at jeg kunne skrive på morsmålet mitt: det gjorde opplevelsen mye morsommere.