Mitä bootstrap-arvot osoittavat lajien välisestä suhteesta? Työskentelen Mega-ohjelman parissa, mutta en ymmärrä mitä bootstrap-arvo tarkoittaa yksinkertaisesti ja mitä se osoittaa lajien välisestä suhteesta
Kommentit
- Tervetuloa Biology.SE-sivustoon! Mitä tutkimuksia olet tehnyt ennen kuin kysyt sitä täältä?
Vastaa
Bootstrap-arvot kuuluvat laajaan arvoluokkaan nimeltä tukiarvot . Tukiarvoja käytetään yleensä osoittamaan jonkin verran missä määrin voidaan luottaa siihen, että haara edustaa jotakin datassa olevaa ”signaalia”.
Käynnistysarvot osoittavat erityisesti, kuinka vankka puun oksat ovat toisin sanoen kuinka kestäviä ne ovat tietojen häiriöille. Ne saadaan ottamalla uudelleen näytteet tietomatriisissa olevista sarakkeista rakentamalla puita uudelleen otetuista näytteistä matriiseja ja tarkastelemalla saatujen osuutta puut, jotka sisältävät tietyn haaran.
Käynnistysvaiheen tapauksessa uudelleen näytteenotto tapahtuu seuraavasti: Oletetaan, että alkuperäisessä datamatriisissa on N saraketta (ts. N koodattua merkkiä, jotka voivat olla nukleotideja tai aminohappoja sekvenssirivistyksessä, morfologiset merkit, genomisten ominaisuuksien läsnäolo-puuttuminen jne.). Uusi matriisi saadaan piirtämällä satunnaisesti yksi näistä sarakkeista N kertaa. Uudella matriisilla on siis sama määrä merkkejä, mutta jotkut alkuperäisestä matriisista ovat läsnä useita kertoja ja jotkut puuttuvat. Tämä vaikuttaa puun topologiaan. Esimerkiksi, jos haaraa tukivat merkit, jotka nyt puuttuvat, tämä haara ei välttämättä enää näy tämän erityisen näytteenoton yhteydessä. Uudelleenotanta tehdään yleensä noin 100 tai 1000 kertaa.
Alhainen käynnistyshihna-arvo tarkoittaa, että jos puu rakennetaan käyttämällä tietojen osajoukkoa, on todennäköistä, että tätä haaraa ei tule näkyviin.
Korkea bootstrap-arvo tarkoittaa, että haara todennäköisesti ilmestyy puuhun, joka on rakennettu tällaisesta uudelleen otetusta matriisista. Tämä ei välttämättä tarkoita sitä, että haara edustaa todennäköisemmin todellisia historiallisia suhteita, vaikka: joskus jälleenrakennuksen artefaktit voivat olla vankkoja. Esimerkiksi joillakin molekyylifylogeenien rekonstruointimenetelmillä taksonit voivat päätyä ryhmittymään genomikoostumuksen samankaltaisuuksien perusteella. Korkeat käynnistysarvot osoittavat, että haaraa tukevassa datassa on vahva signaali, olipa se sitten historiallinen signaali tai muu.
re-sampling columns in the data matrix
todella tarkoittaa. Tarkoittaako se sekvensoitujen SNP: iden, käytettävissä olevien henkilöiden tai joidenkin muiden esikäsiteltyjen tilastojen alijoukkoa …?