ブートストラップ値

ブートストラップ値は、種間の関係について何を示していますか?私はメガプログラムに取り組んでいますが、ブートストラップ値が簡単に何を意味するのか、また種間の関係について何を示しているのかわかりません

コメント

  • Biology.SEへようこそ!ここで質問する前に、どのような調査を行いましたか?

回答

ブートストラップ値は、サポート値と呼ばれる幅広いカテゴリの値に属しています。一般に、サポート値は、ブランチがデータに存在する「シグナル」を表していると確信できる程度。

特に、ブートストラップ値は、堅牢ツリーのブランチは、データの摂動に対する耐性があります。これらは、データマトリックスの列を再サンプリングし、そのような再サンプリングからツリーを構築することによって取得されます。行列、および得られたの割合を見て特定のブランチを含むツリー。

ブートストラップの場合、リサンプリング手順は次の方法で実行されます。元のデータマトリックスにN列があるとします(つまり、 N個のコード化された文字。配列アラインメントのヌクレオチドまたはアミノ酸、形態学的文字、ゲノム機能の有無など)。これらの列の1つをN回ランダムに描画することにより、新しいマトリックスが取得されます。したがって、新しいマトリックスの文字数は同じになりますが、元のマトリックスの一部は複数回存在し、一部は存在しません。これは、ツリーのトポロジに影響します。たとえば、現在存在しない文字によってブランチがサポートされていた場合、この特定のリサンプリングでは、このブランチは表示されなくなる可能性があります。通常、リサンプリングは約100回または1000回行われます。

ブートストラップ値が低いということは、データのサブセットを使用してツリーが構築されている場合、このブランチが表示されない可能性が高いことを意味します。

ブートストラップ値が高いということは、そのような再サンプリングされたマトリックスから構築されたツリーにブランチが表示される可能性が高いことを意味します。ただし、これは必ずしもブランチが真の履歴関係を表す可能性が高いことを意味するわけではありません。場合によっては、再構築アーティファクトが堅牢になることがあります。たとえば、いくつかの分子系統再構築法では、分類群はゲノム組成の類似性に基づいてグループ化される可能性があります。高いブートストラップ値は、ブランチをサポートするデータに強いシグナルがあることを示します。これは、履歴シグナルであろうとその他であろうと。

コメント

  • 正解+ 1.1。リサンプリングの方法を明確にしていただけませんか。マトリックスでデータがどのように編成されているかを説明するだけで、re-sampling columns in the data matrixの実際の意味を明確にするのに役立つ場合があります。シーケンスされたSNP、利用可能な個人、またはその他の前処理された統計などをサブセット化することを意味しますか?
  • @ Remi.b答えを少し拡張しようとしました。これは、個人(従来は行としてエンコード)ではなく、文字(通常は列としてエンコード)のリサンプリングです。個体のリサンプリングは異なる分類群のツリーにつながるため、ツリー間のブランチを単純に比較してブランチサポート値を計算することは不可能であることに注意してください。
  • @ Remi.bフランス語で、これらのサポート値に興味がある場合は、私の論文の紹介をご覧ください( tel.archives-ouvertes.fr/tel-00331825の9ページと10ページ)。 " perturbations de l é chantillonnage taxinomique "について次のように言及したことがわかります。堅牢性を測定していますが、'自分が何を考えていたか思い出せません…
  • 人々がまだフランス語で博士論文を書いていることを知りませんでした!論文のためだけに出版物を英語からフランス語に翻訳しなければならないのは苦痛のように感じます。はい、フランス語が読めます。リンクをありがとう。
  • フランスでは、これらをフランス語で書くことは今でもかなり一般的だと思います(特に人文科学だけでなく)。論文の本文はフランス語で書かれていましたが、記事はそのまま英語で掲載されていました。 '母国語で書くことができてうれしいです。それにより、体験がはるかに楽しくなりました。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です