Hvad angiver bootstrap-værdierne om forholdet mellem arten? Jeg arbejder på Mega-programmet, men jeg forstår ikke, hvad bootstrap-værdi betyder i enkle vendinger, og også hvad betyder det om forholdet mellem arter
Kommentarer
- Velkommen til Biology.SE! Hvilken forskning har du lavet, før du spurgte den her?
Svar
Bootstrap-værdierne hører til en bred kategori af værdier kaldet supportværdier . Supportværdier generelt bruges til at give en vis indikation af i hvilken grad man kan være sikker på, at grenen repræsenterer noget “signal” til stede i dataene.
Især bootstrap-værdier angiver, hvordan robust grenene i træet er, det vil sige, hvor modstandsdygtige de er for forstyrrelse i dataene. De opnås ved re-sampling af kolonner i datamatrixen, ved at bygge træer fra en sådan samplet matricer og ser på andelen af den opnåede træer, der indeholder en given gren.
I tilfælde af bootstrap udføres gentagningstrinet på følgende måde: Antag, at den originale datamatrix har N-kolonner (dvs. N-kodede tegn, der kan være nukleotider eller aminosyrer i en sekvensjustering, morfologiske karakterer, tilstedeværelse-fravær af genomiske træk osv.). En ny matrix opnås ved tilfældigt at tegne en af disse kolonner, N gange. Den nye matrix vil derfor have det samme antal tegn, men nogle fra den oprindelige matrix vil være til stede flere gange, og andre vil være fraværende. Dette vil påvirke træets topologi. For eksempel, hvis en gren blev understøttet af tegn, der nu mangler, vises denne gren muligvis ikke mere med denne særlige re-sampling. Genudtagningen udføres normalt omkring 100 eller 1000 gange.
En lav bootstrap-værdi betyder, at hvis træet er bygget ved hjælp af en delmængde af dataene, er det sandsynligt, at denne gren ikke vises.
En høj bootstrap-værdi betyder, at grenen sandsynligvis vises på et træ, der er bygget fra en sådan en igen samplet matrix. Dette betyder ikke nødvendigvis, at grenen sandsynligvis repræsenterer de ægte historiske forhold, men nogle gange kan genopbygningsgenstande være robuste. For eksempel med nogle molekylære fylogeni-rekonstruktionsmetoder kan taxa ende med at blive grupperet baseret på ligheder i genomets sammensætning. Høje bootstrap-værdier indikerer, at der er et stærkt signal i dataene, der understøtter grenen, det være sig historisk signal eller andet.
Kommentarer
- Dejligt svar + 1. Har du noget imod at afklare, hvordan vi prøver igen. Bare at forklare, hvordan dataene er organiseret i matrixen, kan hjælpe med at afklare, hvad
re-sampling columns in the data matrix
virkelig betyder. Betyder det at underindstille SNPerne, der er sekventeret, eller de personer, der er tilgængelige, eller nogle andre forbehandlede statistikker osv …? - @ Remi.b Jeg forsøgte at udvide mit svar lidt. Dette er genudtagning af tegn (konventionelt kodet som kolonner), ikke enkeltpersoner (konventionelt kodet som linjer). Bemærk, at genudtagning af enkeltpersoner vil føre til træer på forskellige sæt taxa, og det ville derfor være umuligt at blot sammenligne grene mellem træer og beregne grenstøtteværdier.
- @ Remi.b Hvis du kan læse Fransk og er interesseret i disse ting, der understøtter værdier, kan du se på introduktionen af min afhandling (side 9 og 10 i tel.archives-ouvertes.fr/tel-00331825 ). Jeg ser, at jeg nævnte " forstyrrelser de l é chantillonnage taxinomique " på måder måling af robusthed, men jeg kan ikke ' ikke huske, hvad jeg havde i tankerne …
- Wow jeg vidste ikke, at folk stadig skriver ph.d.-afhandling på fransk! Det føles som en smerte at skulle oversætte dine publikationer fra engelsk til fransk bare til specialet. Ja, jeg kan læse fransk. Tak for linket.
- I Frankrig synes jeg det stadig er ret almindeligt at skrive afhandlinger på fransk (især inden for humaniora, men ikke kun). Specialets hovedtekst blev skrevet på fransk, men artiklerne blev inkluderet som de er på engelsk. Jeg er ' glad for, at jeg kunne skrive på mit modersmål: det gjorde oplevelsen meget sjovere.