Bootstrap-arvot

Mitä bootstrap-arvot osoittavat lajien välisestä suhteesta? Työskentelen Mega-ohjelman parissa, mutta en ymmärrä mitä bootstrap-arvo tarkoittaa yksinkertaisesti ja mitä se osoittaa lajien välisestä suhteesta

Kommentit

  • Tervetuloa Biology.SE-sivustoon! Mitä tutkimuksia olet tehnyt ennen kuin kysyt sitä täältä?

Vastaa

Bootstrap-arvot kuuluvat laajaan arvoluokkaan nimeltä tukiarvot . Tukiarvoja käytetään yleensä osoittamaan jonkin verran missä määrin voidaan luottaa siihen, että haara edustaa jotakin datassa olevaa ”signaalia”.

Käynnistysarvot osoittavat erityisesti, kuinka vankka puun oksat ovat toisin sanoen kuinka kestäviä ne ovat tietojen häiriöille. Ne saadaan ottamalla uudelleen näytteet tietomatriisissa olevista sarakkeista rakentamalla puita uudelleen otetuista näytteistä matriiseja ja tarkastelemalla saatujen osuutta puut, jotka sisältävät tietyn haaran.

Käynnistysvaiheen tapauksessa uudelleen näytteenotto tapahtuu seuraavasti: Oletetaan, että alkuperäisessä datamatriisissa on N saraketta (ts. N koodattua merkkiä, jotka voivat olla nukleotideja tai aminohappoja sekvenssirivistyksessä, morfologiset merkit, genomisten ominaisuuksien läsnäolo-puuttuminen jne.). Uusi matriisi saadaan piirtämällä satunnaisesti yksi näistä sarakkeista N kertaa. Uudella matriisilla on siis sama määrä merkkejä, mutta jotkut alkuperäisestä matriisista ovat läsnä useita kertoja ja jotkut puuttuvat. Tämä vaikuttaa puun topologiaan. Esimerkiksi, jos haaraa tukivat merkit, jotka nyt puuttuvat, tämä haara ei välttämättä enää näy tämän erityisen näytteenoton yhteydessä. Uudelleenotanta tehdään yleensä noin 100 tai 1000 kertaa.

Alhainen käynnistyshihna-arvo tarkoittaa, että jos puu rakennetaan käyttämällä tietojen osajoukkoa, on todennäköistä, että tätä haaraa ei tule näkyviin.

Korkea bootstrap-arvo tarkoittaa, että haara todennäköisesti ilmestyy puuhun, joka on rakennettu tällaisesta uudelleen otetusta matriisista. Tämä ei välttämättä tarkoita sitä, että haara edustaa todennäköisemmin todellisia historiallisia suhteita, vaikka: joskus jälleenrakennuksen artefaktit voivat olla vankkoja. Esimerkiksi joillakin molekyylifylogeenien rekonstruointimenetelmillä taksonit voivat päätyä ryhmittymään genomikoostumuksen samankaltaisuuksien perusteella. Korkeat käynnistysarvot osoittavat, että haaraa tukevassa datassa on vahva signaali, olipa se sitten historiallinen signaali tai muu.

Kommentit

  • Hieno vastaus + 1. Haluatko selvittää, kuinka otamme näytteen. Pelkkä selitys siitä, miten data on järjestetty matriisiin, voi auttaa selventämään, mitä re-sampling columns in the data matrix todella tarkoittaa. Tarkoittaako se sekvensoitujen SNP: iden, käytettävissä olevien henkilöiden tai joidenkin muiden esikäsiteltyjen tilastojen alijoukkoa …?
  • @ Remi.b Yritin laajentaa vastaustani hieman. Tämä on merkkien (tavallisesti sarakkeiksi koodattu), ei yksilöiden (tavallisesti viivoiksi koodattu) otanta. Huomaa, että yksilöiden uudelleenotanta johtaisi puihin erilaisilla taksoneilla, ja siksi olisi mahdotonta yksinkertaisesti vertailla oksia puiden välillä ja laskea oksan tukiarvoja.
  • @ Remi.b Jos voit lukea Ranskalaiset ja olet kiinnostunut näistä tukiarvojen asiasta, saatat tarkastella opinnäytetyöni johdantoa (sivut 9 ja 10 / tel.archives-ouvertes.fr/tel-00331825 ). Huomasin, että mainitsin " häiriöt de l é chantillonnage taxinomique " tavoin mittaa kestävyyttä, mutta en voi ' muistaa mitä tarkoitin …
  • Vau en tiennyt, että ihmiset kirjoittavat edelleen väitöskirjaa ranskaksi! Tuntuu tuskalta joutua kääntämään julkaisusi englannista ranskaksi vain opinnäytetyön vuoksi. Kyllä, osaan lukea ranskaa. Kiitos linkistä.
  • Ranskassa mielestäni on edelleen melko yleistä kirjoittaa opinnäytteitä ranskaksi (erityisesti humanistisissa tieteissä, mutta ei vain). Opinnäytetyön pääteksti kirjoitettiin ranskaksi, mutta artikkelit sisällytettiin sellaisenaan englanniksi. Olen ' iloinen voidessani kirjoittaa äidinkielelläni: se teki kokemuksesta paljon nautinnollisempaa.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *