Ce indică valorile bootstrap despre relația dintre specie? Lucrez la programul Mega, dar nu înțeleg ce înseamnă bootstrap în termeni simpli și, de asemenea, ce indică despre relația dintre specii
Comentarii
- Bine ați venit la Biology.SE! Ce cercetări ați făcut înainte să o întrebați aici?
Răspuns
Valorile bootstrap aparțin unei categorii largi de valori numite valori de suport . În general, valorile suportului sunt utilizate pentru a da unele indicații despre gradul în care se poate avea încredere că ramura reprezintă un „semnal” prezent în date.
În special, valorile bootstrap indică modul în care robust ramurile din copac sunt, adică cât de rezistente sunt la perturbarea datelor. Sunt obținute prin eșantionarea coloanelor din matricea de date, construind copaci din astfel de eșantioane matrice și analizând proporția celor obținute copaci care conțin o ramură dată.
În cazul bootstrap, pasul de re-eșantionare se face în felul următor: Să presupunem că matricea de date originală are N coloane (adică N caractere codificate, care pot fi nucleotide sau aminoacizi într-o aliniere a secvenței, caractere morfologice, prezență-absență a trăsăturilor genomice etc.). O nouă matrice va fi obținută prin desenarea aleatorie a uneia dintre aceste coloane de N ori. Prin urmare, noua matrice va avea același număr de caractere, dar unele din matricea originală vor fi prezente de mai multe ori, iar altele vor fi absente. Acest lucru va influența topologia arborelui. De exemplu, dacă o ramură a fost susținută de caractere care sunt acum absente, această ramură poate să nu mai apară cu această re-eșantionare specială. Re-eșantionarea se face de obicei de aproximativ 100 sau 1000 de ori.
O valoare de bootstrap scăzută înseamnă că, dacă arborele este construit folosind un subset de date, este probabil ca această ramură să nu apară.
O valoare mare de bootstrap înseamnă că ramura va apărea probabil pe un copac construit dintr-o astfel de matrice re-eșantionată. Acest lucru nu înseamnă neapărat că ramura este mai probabil să reprezinte adevăratele relații istorice, deși: uneori, artefactele de reconstrucție pot fi robuste. De exemplu, cu unele metode de reconstrucție a filogeniei moleculare, taxonii pot ajunge să fie grupați pe baza asemănărilor în compoziția genomului. Valorile ridicate ale bootstrap-ului indică faptul că există un semnal puternic în datele care susțin ramura, fie că este un semnal istoric sau altele.
Comentarii
- Răspuns frumos + 1. V-ar deranja să clarificați modul în care reesamplăm. Doar explicarea modului în care sunt organizate datele în matrice ar putea ajuta la clarificarea a ceea ce înseamnă cu adevărat
re-sampling columns in the data matrix
. Înseamnă subsetarea SNP-urilor secvențiate, sau a persoanelor disponibile, sau a altor statistici pre-procesate, etc …? - @ Remi.b Am încercat să extind puțin răspunsul meu. Aceasta este re-eșantionare de caractere (codificate convențional ca coloane), nu de persoane (codificate convențional ca linii). Rețineți că eșantionarea individuală ar duce la copaci pe diferite seturi de taxoni și, prin urmare, ar fi imposibil să comparați pur și simplu ramurile dintre copaci și să calculați valorile suportului ramurilor.
- @ Remi.b Dacă puteți citi Franceză și sunteți interesat de aceste valori de susținere, puteți arunca o privire asupra introducerii tezei mele (paginile 9 și 10 din tel.archives-ouvertes.fr/tel-00331825 ). Văd că am menționat " perturbations de l é chantillonnage taxinomique " în moduri de măsurând robustețea, dar nu pot ' să-mi amintesc ce aveam în minte …
- Uau, nu știam că oamenii încă scriu teza de doctorat în franceză! Se pare că este o durere să traduceți publicațiile dvs. din engleză în franceză doar pentru teză. Da, pot citi franceza. Vă mulțumim pentru link.
- În Franța, cred că este încă destul de obișnuit să scrieți teze în franceză (în special în domeniul umanist, dar nu numai). Textul principal al tezei a fost scris în franceză, dar articolele au fost incluse ca atare, în engleză. ' sunt fericit că am putut scrie în limba mea maternă: experiența a făcut-o mult mai plăcută.