Statistical potentials for improved structurally constrained evolutionary models.
Kleinman, C.L., Rodrigue, N., Lartillot, N., et Philippe, H. (2010). « Statistical potentials for improved structurally constrained evolutionary models. », Molecular Biology and Evolution, 27(7), p. 1546-1560. doi : 10.1093/molbev/msq047
Résumé
Il est difficile d’évaluer l’effet de la structure tridimensionnelle d’une protéine sur l’évolution de sa séquence, notamment en raison de l’hypothèse d’indépendance entre les sites requise par les méthodes de phylogénétique probalistiques. Récemment, des modèles comprenant le traitement explicite de la structure protéique et l’interdépendance des sites ont été mis au point : un potentiel statistique (c’est-à-dire un système d’évaluation de l’énergie fondé sur la compatibilité séquence–structure) sert à estimer la probabilité de fixation d’une mutation donnée, si l’on suppose une structure protéique générale constante dans le temps. Toutefois, en raison de la nouveauté de ces modèles et du peu de chevauchement entre la biologie structurale et la biologie évolutive, seules des structures protéiques simples ont été utilisées jusqu’à présent. Nous présentons ici de nouvelles formes de potentiels statistiques dans un cadre probabiliste récemment mis au point pour des études sur l’évolution. Pour pouvoir étudier les principaux facteurs influant sur la structure des protéines, nous avons inclus les éléments suivants dans les potentiels : interactions entre les appariements, angles de torsion, accessibilité au solvant, flexibilité des résidus. Avec une représentation plus détaillée de la structure protéique, ces nouveaux potentiels permettent un meilleur ajustement que celui obtenu avec les fonctions de notation utilisées auparavant. En fait, ce sont les interactions entre les appariements qui contribuent le plus à cette amélioration. Dans un contexte phylogénétique, toutefois, les modèles avec contraintes structurales demeurent moins intéressants que certains des modèles non liés aux sites en termes d’ajustement, ce qui signifie peut-être qu’on devrait explorer d’autres potentiels statistiques que ceux fondés la structure grossière des protéines afin de mieux prédire les contraintes structurales.