Valores de bootstrap

¿Qué indican los valores de bootstrap sobre la relación entre las especies? Estoy trabajando en el programa Mega, pero no entiendo qué significa el valor de arranque en términos simples y también qué indica sobre la relación entre las especies

Comentarios

  • ¡Bienvenido a Biology.SE! ¿Qué investigación ha hecho antes de preguntar aquí?

Responder

Los valores de bootstrap pertenecen a una amplia categoría de valores denominada valores de soporte . Los valores de soporte en general se utilizan para dar alguna indicación de el grado en el que uno puede estar seguro de que la rama representa alguna «señal» presente en los datos.

En particular, los valores de arranque indican cuán robusto las ramas del árbol son, es decir, qué tan resistentes son a la perturbación en los datos. Se obtienen volviendo a muestrear columnas en la matriz de datos, construyendo árboles a partir de tales matrices, y mirando la proporción de los obtenidos árboles que contienen una rama determinada.

En el caso de bootstrap, el paso de remuestreo se realiza de la siguiente manera: Supongamos que la matriz de datos original tiene N columnas (es decir, N caracteres codificados, que pueden ser nucleótidos o aminoácidos en un alineamiento de secuencia, caracteres morfológicos, presencia-ausencia de características genómicas, etc.). Se obtendrá una nueva matriz dibujando al azar una de estas columnas, N veces. Por lo tanto, la nueva matriz tendrá el mismo número de caracteres, pero algunos de la matriz original estarán presentes varias veces y algunos estarán ausentes. Esto influirá en la topología del árbol. Por ejemplo, si una rama fue apoyada por caracteres que ahora están ausentes, esta rama puede no aparecer más con este nuevo muestreo en particular. El remuestreo generalmente se realiza alrededor de 100 o 1000 veces.

Un valor de arranque bajo significa que si el árbol se construye usando un subconjunto de los datos, es probable que esta rama no aparezca.

Un valor de arranque alto significa que la rama probablemente aparecerá en un árbol construido a partir de una matriz reemuestreada. Sin embargo, esto no significa necesariamente que es más probable que la rama represente las verdaderas relaciones históricas: a veces, los artefactos de reconstrucción pueden ser robustos. Por ejemplo, con algunos métodos de reconstrucción de filogenia molecular, los taxones pueden terminar agrupados en función de las similitudes en la composición del genoma. Los valores altos de bootstrap indican que hay una señal fuerte en los datos que respaldan la rama, ya sea una señal histórica u otra.

Comentarios

  • Buena respuesta + 1. ¿Le importaría aclarar cómo volvemos a muestrear? El simple hecho de explicar cómo están organizados los datos en la matriz puede ayudar a aclarar qué significa realmente re-sampling columns in the data matrix. ¿Significa subconjuntos de los SNP secuenciados, o los individuos disponibles, o algunas otras estadísticas preprocesadas, etc.?
  • @ Remi.b Traté de expandir un poco mi respuesta. Se trata de un nuevo muestreo de caracteres (codificados convencionalmente como columnas), no de individuos (codificados convencionalmente como líneas). Tenga en cuenta que volver a tomar muestras de individuos conduciría a árboles en diferentes conjuntos de taxones y, por lo tanto, sería imposible simplemente comparar ramas entre árboles y calcular los valores de soporte de las ramas.
  • @ Remi.b Si puede leer Francés y está interesado en estos valores de apoyo, puede echar un vistazo a la introducción de mi tesis (páginas 9 y 10 de tel.archives-ouvertes.fr/tel-00331825 ). Veo que mencioné " perturbations de l é chantillonnage taxinomique " en formas de midiendo la robustez, pero no puedo ' recordar lo que tenía en mente …
  • ¡Vaya, no sabía que la gente todavía está escribiendo tesis doctorales en francés! Se siente como un dolor tener que traducir sus publicaciones del inglés al francés solo para la tesis. Sí, puedo leer en francés. Gracias por el enlace.
  • En Francia, creo que todavía es bastante común escribir tesis en francés (especialmente en humanidades, pero no solo). El texto principal de la tesis se escribió en francés, pero los artículos se incluyeron tal cual, en inglés. Estoy ' feliz de poder escribir en mi lengua materna: hizo que la experiencia fuera mucho más agradable.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *