Quindiquent les valeurs bootstrap sur la relation entre les espèces? Je travaille sur le programme Mega mais je ne comprends pas ce que signifie la valeur bootstrap en termes simples et aussi ce que cela indique sur la relation entre les espèces
Commentaires
- Bienvenue sur Biology.SE! Quelles recherches avez-vous effectuées avant de le poser ici?
Réponse
Les valeurs bootstrap appartiennent à une large catégorie de valeurs appelées valeurs de prise en charge . Les valeurs de prise en charge en général sont utilisées pour donner une indication sur le degré auquel on peut être sûr que la branche représente un « signal » présent dans les données.
En particulier, les valeurs de bootstrap indiquent à quel point robuste les branches de larbre sont, cest-à-dire leur résistance aux perturbations dans les données. Elles sont obtenues en rééchantillonnant des colonnes dans la matrice de données, en construisant des arbres à partir de ces rééchantillonnages matrices, et en regardant la proportion de la les arbres qui contiennent une branche donnée.
Dans le cas du bootstrap, létape de rééchantillonnage se fait de la manière suivante: Supposons que la matrice de données dorigine a N colonnes (cest-à-dire N caractères codés, qui peuvent être des nucléotides ou des acides aminés dans un alignement de séquence, des caractères morphologiques, présence-absence de caractéristiques génomiques, etc.). Une nouvelle matrice sera obtenue en tirant au hasard lune de ces colonnes, N fois. La nouvelle matrice aura donc le même nombre de caractères, mais certains de la matrice dorigine seront présents plusieurs fois et certains seront absents. Cela influencera la topologie de larborescence. Par exemple, si une branche était supportée par des caractères qui sont maintenant absents, cette branche peut ne plus apparaître avec ce rééchantillonnage particulier. Le ré-échantillonnage est généralement effectué environ 100 ou 1000 fois.
Une valeur de bootstrap faible signifie que si larbre est construit à laide dun sous-ensemble de données, il est probable que cette branche napparaîtra pas.
Une valeur damorçage élevée signifie que la branche apparaîtra probablement sur un arbre construit à partir dune telle matrice rééchantillonnée. Cela ne signifie pas nécessairement que la branche est plus susceptible de représenter les vraies relations historiques: parfois, les artefacts de reconstruction peuvent être robustes. Par exemple, avec certaines méthodes de reconstruction de la phylogénie moléculaire, les taxons peuvent finir par être regroupés en fonction de similitudes dans la composition du génome. Des valeurs de bootstrap élevées indiquent quil y a un signal fort dans les données supportant la branche, que ce soit un signal historique ou autre.
Commentaires
- Bonne réponse + 1. Pourriez-vous clarifier la façon dont nous rééchantillonnons. Le simple fait dexpliquer comment les données sont organisées dans la matrice peut aider à clarifier ce que
re-sampling columns in the data matrix
signifie vraiment. Cela signifie-t-il un sous-ensemble des SNP séquencés, ou des individus disponibles, ou dautres statistiques pré-traitées, etc …? - @ Remi.b Jai essayé délargir un peu ma réponse. Il sagit dun rééchantillonnage de caractères (codés de manière conventionnelle sous forme de colonnes) et non dindividus (conventionnellement codés sous forme de lignes). Notez que le rééchantillonnage dindividus conduirait à des arbres sur différents ensembles de taxons, et il serait donc impossible de comparer simplement les branches entre les arbres et de calculer les valeurs de support des branches.
- @ Remi.b Si vous savez lire Français et intéressés par ces valeurs de support, vous pouvez jeter un œil à lintroduction de ma thèse (pages 9 et 10 de tel.archives-ouvertes.fr/tel-00331825 ). Je vois que jai mentionné " perturbations de l é chantillonnage taxinomique " de manière mesurer la robustesse, mais je ne peux ' me souvenir de ce que javais en tête …
- Wow je ne savais pas que les gens rédigent encore une thèse de doctorat en français! Cest un peu pénible de devoir traduire vos publications de langlais vers le français juste pour la thèse. Oui, je peux lire le français. Merci pour le lien.
- En France, je pense quil est encore assez courant décrire des thèses en français (surtout en sciences humaines, mais pas seulement). Le texte principal de la thèse a été rédigé en français, mais les articles ont été inclus tels quels, en anglais. Je ' je suis heureux de pouvoir écrire dans ma langue maternelle: cela a rendu lexpérience beaucoup plus agréable.