en fr Analysis and prediction of the sequence - local structure - flexibility relationships in globular proteins Analyse et prédiction de la relation séquence - structure locale et flexibilité au sein des protéines globulaireReportar como inadecuado




en fr Analysis and prediction of the sequence - local structure - flexibility relationships in globular proteins Analyse et prédiction de la relation séquence - structure locale et flexibilité au sein des protéines globulaire - Descarga este documento en PDF. Documentación en PDF para descargar gratis. Disponible también para leer online.

1 DSIMB Réunion - Dynamique des Structures et Interactions des Macromolécules Biologiques- Pôle de La Réunion DSIMB - Dynamique des Structures et Interactions des Macromolécules Biologiques, Université de la Réunion : UMR S665 2 INTS - Institut National de la Transfusion Sanguine Paris

Abstract : In silico prediction of protein structure from sequence is a major scientific challenge. It is now admitted that native 3D protein structures can be described by a limited set of recurring local structures. This observation led to the development of protein structure prediction techniques based on fragment assembly methods. Nowadays, these techniques are among the most effective. Protein local structure prediction is the first step toward the generation of global protein models. This thesis work mainly focuses on two major questions: i protein local structure prediction from sequence and ii the analysis of local structure predictability according to protein structure flexibility features. These analyses were based on a library - previously developed in the laboratory - of 120 3D structural prototypes encompassing all known local protein structures. An associated local structure prediction method from sequence had also been created and yielded a correct prediction rate of 51 %. Here, we achieved a balanced improvement of the prediction rate by coupling evolutionary information with Support Vector Machines. A very satisfying correct prediction rate of 63 % was obtained. Moreover, for directly estimating the quality of the prediction, we developed a confidence index which enables to identify regions that are more difficult to predict. In the same way, protein structures are not rigid macromolecules. Hence, we also extended our analysis and addressed the question of the structural predictability of a sequence with regards to its structural flexibility properties inside protein structures. We analyzed local structure flexibility features in proteins by relying on: i B-factors from X-ray experiments and ii backbone fluctuations observed in molecular dynamics simulations. Finally, an original flexibility prediction method from sequence was developed. Our different analyses are the first step toward the prediction of 3D global protein models.

Résumé : La prédiction in silico de la structure tridimensionnelle d-une protéine à partir de sa séquence en acides aminés constitue un défi scientifique d-intérêt majeur. Il est à présent admis que les structures protéiques peuvent être décrites à partir d-un répertoire limité de structures locales récurrentes. Cette observation a conduit au développement de techniques de prédiction de la structure 3D par assemblage de fragments. Ces techniques sont aujourd-hui parmi les plus performantes. Dans ce contexte, la prédiction des structures locales constitue une première étape vers la prédiction de la structure 3D globale d-une protéine. Mon travail de thèse porte principalement sur l-étude des structures protéiques locales à travers deux thèmes : i la prédiction des structures locales à partir de la séquence et ii l-analyse de la prédictibilité des structures locales en fonction de la flexibilité des structures protéiques. Ces études reposent sur une bibliothèque de 120 fragments chevauchants de 11 résidus de long précédemment développée au sein du laboratoire. Une méthode de prédiction des structures locales à partir de la séquence avait également été mise en place et permettait d-obtenir un taux de prédiction correct de 51 %. La prise en compte de données évolutionnaires couplée à l-utilisation de Machines à Vecteurs de Support a permis d-améliorer la prédiction des structures locales jusqu-à 63 % de prédiction correctes. De plus, un indice de confiance permettant d-évaluer directement la qualité de la prédiction et ainsi d-identifier les régions plus ardues à prédire a été mis au point. Par ailleurs, la structure des protéines n-est pas rigide. Ainsi, j-ai étendu notre analyse à l-étude la prédictibilité structurale des séquences d-acides aminés en fonction de leur flexibilité structurale au sein des protéines. Une analyse des propriétés dynamiques des structures locales a été menée en s-appuyant sur i les B-facteurs issus des expériences de cristallographie et ii les fluctuations du squelette polypeptidique observées lors de simulations de dynamique moléculaire. Ces analyses de la relation flexibilité-structure locale ont conduit au développement d-une stratégie de prédiction originale de la flexibilité à partir de la séquence. Nos différentes approches constituent une première étape vers la prédiction de la structure tridimensionnelle globale d-une protéine.

en fr

Keywords : Protein local structure prediction Protein flexibility prediction Machine learning

Mots-clés : Prédiction de la structure locale des protéines Prédiction de la flexibilité des protéines Apprentissage automatique SVM





Autor: Aurélie Bornot -

Fuente: https://hal.archives-ouvertes.fr/



DESCARGAR PDF




Documentos relacionados