Recherche de protéines de S-layer archéennes par homologie de séquence et analyses phylogénétiques
Roomans, Célyne
Promotor(s) : Baurain, Denis
Date of defense : 6-Sep-2022 • Permalink : http://hdl.handle.net/2268.2/16278
Details
Title : | Recherche de protéines de S-layer archéennes par homologie de séquence et analyses phylogénétiques |
Author : | Roomans, Célyne |
Date of defense : | 6-Sep-2022 |
Advisor(s) : | Baurain, Denis |
Committee's member(s) : | Kerff, Frédéric
Galleni, Moreno Tocquin, Pierre |
Language : | French |
Number of pages : | 88 |
Discipline(s) : | Life sciences > Biochemistry, biophysics & molecular biology |
Institution(s) : | Université de Liège, Liège, Belgique |
Degree: | Master en bioinformatique et modélisation, à finalité approfondie |
Faculty: | Master thesis of the Faculté des Sciences |
Abstract
[fr] La paroi cellulaire de la presque totalité des archées décrites jusqu’à présent se compose d’une couche protéique superficielle, appelée S-layer. Cette structure correspond à un réseau cristallin bidimensionnel recouvrant l’entièreté de la cellule et contenant un ou deux types de protéines. La séquence en acides aminés des protéines composant la S-layer (SLPs) confère à ces dernières la capacité intrinsèque de d’auto-assembler en réseau monomoléculaire. Cependant, la diversité des séquences des protéines de S-layer est énorme, si bien que peu – voire pas – de similitudes sont observables entre organismes étroitement apparentés. Ce constat amène à s’interroger sur l’origine évolutive de cette structure.
Un travail de littérature a d’abord été réalisé afin de relever les protéines de S-layer archéennes ayant été décrites jusqu’à présent. Les séquences protéiques correspondantes ont été récoltées et regroupées en 49 clusters selon leur similarité de séquences. Une recherche par homologie de séquences (BLASTp) contre une base de données d’archées représentatives a ensuite été réalisée dans le but d’enrichir les clusters et découvrir si des SLPs étaient représentées dans différents groupes taxonomiques. Les résultats obtenus montrent que les séquences de SLPs divergent fortement et que, par conséquent, aucune protéine n’est présente dans plusieurs groupes taxonomiques d’archées.
Des profils HMM pour les 33 clusters pertinents ont été construits puis utilisés afin d’identifier de nouvelles séquences et d’étudier de façon plus sensible la distribution phylogénétique de chaque SLP au sein de leur groupe taxonomique, voire au-delà. Cette analyse a mis en évidence des cas de recouvrement entre clusters qui ont, par conséquent, été fusionnés, étendant de facto la distribution de plusieurs SLPs. Des inférences phylogénétiques des 7 clusters obtenus après fusion ont finalement été effectuées pour étudier l'évolution de ces différentes SLPs. Les arbres résultants montrent que 1) seules les SLPs provenant d’organismes étroitement apparentés aux séquences de référence se sont vues attribuées une annotation automatique et 2) des duplications de gènes plus ou moins récentes ont eu lieu au cours de l’évolution.
En conclusion, nos analyses suggèrent que les SLPs sont effectivement très diverses, mais que leur distribution taxonomique limitée est peut-être en partie liée à une divergence importante de leur séquence primaire, plutôt qu’à une hétérogénéité réelle. Cette hypothèse devrait être testée au travers de l’identification de SLPs additionnelles à intégrer dans nos arbres.
File(s)
Document(s)
Cite this master thesis
The University of Liège does not guarantee the scientific quality of these students' works or the accuracy of all the information they contain.