A Dirichlet process covarion mixture model and its assessments using posterior predictive discrepancy tests.
Zhou, Y., Brinkmann, H., Rodrigue, N., Lartillot, N., et Philippe, H. (2010). « A Dirichlet process covarion mixture model and its assessments using posterior predictive discrepancy tests. », Molecular Biology and Evolution, 27(2), p. 371-384. doi : 10.1093/molbev/msp248
Résumé
L’hétérotachie, la variation du taux de substitutions à un site au fil du temps, est un phénomène fréquent dans les enchaînements de nucléotides et d’acides aminés qui peut fausser les inférences phylogénétiques probabilistes. Le modèle des covarions représente un cas particulier d’hétérotachie, dans lequel les sites passent d’un « état » actif de substitution (permettant des substitutions quel que soit le modèle d’évolution des séquences) à un « état » inactif (aucune substitution). Dans l’utilisation courante du modèle, le taux de variation entre l’état actif et inactif est homogène pour un site donné, mais cette hypothèse n’a jamais été testée. Dans la présente étude, nous avons mis au point un modèle de mélange infini, dit modèle de mélange de covarions (MC), dépendant d’un a priori du processus de Dirichlet et qui permet de varier les paramètres des covarions selon les sites. Nous avons également combiné le modèle de MC à d’autres approches : par exemple, nous avons utilisé un deuxième processus de Dirichlet indépendant pour modéliser l’hétérogénéité des fréquences d’équilibre des acides aminés entre les sites, un modèle connu sous le nom de modèle CAT. L’hétérogénéité générale de la variation des taux de substitution entre les sites est modélisée par une distribution gamma. L’application du modèle de MC à plusieurs alignements montre que les paramètres des covarions sont significativement hétérogènes d’un site à l’autre. Nous décrivons les tests de non-conformité postérieure prédictive que nous avons utilisés pour démontrer l’importance des différents éléments des modèles.